RealisDance-DiT: Simple yet Strong Baseline towards Controllable Character Animation in the Wild
可控的Character Animation任务, 解决in-the-wild环境, 它的观点是大模型越来越强大, 提倡通过简单的修改达到理想效果.
OmniForcing: Unleashing Real-time Joint Audio-Visual Generation
音频-视觉扩散模型在质量上取得成功, 但是由于双向注意力依赖性导致的高延迟, 阻碍实时应用, 将离线, 双流双向蒸馏成高保真流式自回归生成框架, 解决了这个过程中遇到的一系列问题, 单GPU上达到25FPS.
SAM-Body4D: Training-Free 4D Human Body Mesh Recovery from Videos
Human Mesh Recovery(HMR)在图片领域效果好, 但是拓展到视频导致时间不连续, 介绍了一种Training-Free的方法解决这个问题.

