My App

Dancing Avatar: Pose and Text-Guided Human Motion Videos Synthesis with Image Diffusion Model

卖点: 以T2I为基础模型, 增加pose控制信号, 生成无缝时间连贯, IP保持, 高质量的人类motion视频. 方法: 对了空间一致性, 把文本指导的角色知识引入模型, 加入了GPT的见解; 为了保护背景连续性, 融入了图像分割和图像修复的见解; 为了时间一致性, 用自回归的方式, 前一帧指导后一帧的生成.

Loading...