IT之家 10 月 21 日消息,复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。
![](http://n.sinaimg.cn/spider20241021/434/w660h574/20241021/449a-feec5a2cb274bb64199f935ae4ac2dd2.jpg)
Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。
![](http://n.sinaimg.cn/spider20241021/246/w660h386/20241021/e1a6-1c260701bec2778c9894840a505de7e6.jpg)
Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保证了高分辨率视频的质量和流畅性。
此外,Hallo2将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。项目页面介绍称,Hallo2 是第一种实现 4K 分辨率并生成长达 1 小时的音频驱动的人像图像动画的方法,并通过文本提示进行增强。
![](http://n.sinaimg.cn/finance/cece9e13/20240627/655959900_20240627.png)
海量资讯、精准解读,尽在新浪财经APP
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)