Paper

motion Customization

动作定制涉及生成视频, 其中主体执行由输入控制信号指示的动作.

ELF: Embedded Language Flows

基于连续时间流匹配的连续嵌入空间中的扩散语言模型

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

现存的方法通过2D pose或者显式的3D参数模型控制人物动作. 2D的方式不能新视角生成, 显式3D的方式固有的不准确性. 提出隐式, 与视角无关的表示方式, 用单视角, 多视角, 移动镜头多种类型训练数据.