谷歌发布“基础世界模型”Genie 多模态AI浪潮有望加速到来
2024-02-28 07:46:29    财联社
①据媒体报道,谷歌定义了生成式AI的全新范式——Genie,这是一个110亿参数的基础世界模型,可以通过单张图像提示生成可玩的交互式环境。 ②浙商证券发布研报表示,随着海外厂商持续加速多模态AI领域布局,多模态AI新一轮浪潮有望加速到来。

据媒体报道,谷歌定义了生成式AI的全新范式——生成式交互环境(Genie,Generative Interactive Environments)。Genie是一个110亿参数的基础世界模型,可以通过单张图像提示生成可玩的交互式环境。GenieAI是一个利用互联网视频训练的基础世界模型,可以从合成图像、照片甚至素描中生成无限多的可玩(可控制动作的)世界。它的使用范围广泛,可以用于从图像或文本生成整个互动世界,是训练未来通用AI代理的有利工具。

浙商证券发布研报表示,近日英伟达宣布成立GEAR实验室,布局多模态AI以及具身智能领域,另外Stability.ai发布了具备更强文生图能力的Stable Diffusion 3模型,并宣布文生视频应用Stable Video开放公测。随着海外厂商持续加速多模态AI领域布局,多模态AI新一轮浪潮有望加速到来。

据财联社主题库显示,相关上市公司中:

因赛集团的InsightGPT具备文生文、视频智能剪辑、图生视频等功能,目前正在开发文生视频功能。在现有图生视频等技术框架下,InsightGPT目前可生成20秒以上的视频。

万兴科技的天幕大模型具备多媒体、垂直解决方案、算力数据及应用本土化等特色,以更智能、更沉浸的功能效果和产品体验赋能全球内容创作者的创意表达。

风险提示:本文所有观点不构成任何投资买卖建议,据此入市风险自负。股市有风险,投资需谨慎!