My App

JoyStreamer: Unlocking Highly Expressive Avatars via Harmonized Text-Audio Conditioning

现存Video Avatar model在与文本指令对齐方面表现出局限性, 特别是在大幅度全身运动, 动态摄像机轨迹, 背景转换或人与物交互时. 我们的方法支持复杂的应用.

Loading...