谷歌AI制成视频两连发 720p高清+长镜头

发布时间：2022-10-11 19:00:02 所属栏目：外闻来源：互联网

导读： 　　Meta发布「用嘴做视频」仅一周，谷歌CEO劈柴哥接连派出两名选手上场竞争。

　　Imagen Video同样基于最近大火的扩散模型，直接继承自5月份的图像生成SOTA模型Imagen。

　　Meta发布「用嘴做视频」仅一周，谷歌CEO劈柴哥接连派出两名选手上场竞争。

　　Imagen Video同样基于最近大火的扩散模型，直接继承自5月份的图像生成SOTA模型Imagen。

　　除了分辨率高以外，还展示出三种特别能力。

　　首先它能理解并生成不同艺术风格的作品，如“水彩画”或者“像素画”，或者直接“梵高风格”。

　　除了应用效果出色以外，研究人员表示其中用到的一些优化技巧不光对视频生成有效，可以泛化至一般扩散模型。

　　具体来说，Imagen Video是一系列模型的集合。

　　语言模型部分是谷歌自家的 T5-XXL，训练好后冻结住文本编码器部分。

　　与负责从文本特征映射到图像特征的CLIP相比，有一个关键不同：

　　语言模型只负责编码文本特征，把文本到图像转换的工作丢给了后面的视频扩散模型。

　　基础模型，在生成图像的基础上以自回归方式不断预测下一帧，首先生成一个48*24、每秒3帧的视频。

（编辑：成都站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

这是量子优势吗 Quant	新漫评看，美式民主的
三星电子高层大改血，	高通骁龙改名背后品牌