谷歌AI制成视频两连发 720p高清+长镜头
发布时间:2022-10-11 19:00:02 所属栏目:外闻 来源:互联网
导读: Meta发布 「用嘴做视频」 仅一周,谷歌CEO劈柴哥接连派出 两名选手上场竞争。
Imagen Video同样基于最近大火的扩散模型,直接继承自5月份的图像生成SOTA模型Imagen。
Imagen Video同样基于最近大火的扩散模型,直接继承自5月份的图像生成SOTA模型Imagen。
Meta发布 「用嘴做视频」 仅一周,谷歌CEO劈柴哥接连派出 两名选手上场竞争。 Imagen Video同样基于最近大火的扩散模型,直接继承自5月份的图像生成SOTA模型Imagen。 除了分辨率高以外,还展示出三种特别能力。 首先它能理解并生成不同艺术风格的作品,如“水彩画”或者“像素画”,或者直接“梵高风格”。 除了应用效果出色以外,研究人员表示其中用到的一些优化技巧不光对视频生成有效,可以泛化至一般扩散模型。 具体来说,Imagen Video是一系列模型的集合。 语言模型部分是谷歌自家的 T5-XXL,训练好后冻结住文本编码器部分。 与负责从文本特征映射到图像特征的CLIP相比,有一个关键不同: 语言模型只负责编码文本特征,把文本到图像转换的工作丢给了后面的视频扩散模型。 基础模型,在生成图像的基础上以自回归方式不断预测下一帧,首先生成一个48*24、每秒3帧的视频。 (编辑:成都站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐