My App

UniMo: Unifying 2D Video and 3D Human Motion with an Autoregressive Framework

提出UniMo, 一个联合框架可以根据视频预测3D动作, 也可以根据3D动作生成视频. 难点是实质上的结构和分布差异, 并提出了自己的解决方案. 这么做的意义说为什么什么铺平了道路, 没看懂.

Loading...