My App

VPO: Aligning Text-to-Video Generation Models with Prompt Optimization

针对text-to-video任务的提示词优化, 三个核心的原则: 无害, 准确, 有用. 在技术细节上, 采用两步优化, 1)构建有监督微调数据集, 2)文本层次和视频层次的反馈.

Loading...