谷歌发布“基础世界模型”Genie 多模态AI浪潮有望加速到来

2024-02-28 07:46:29 财联社

①据媒体报道，谷歌定义了生成式AI的全新范式——Genie，这是一个110亿参数的基础世界模型，可以通过单张图像提示生成可玩的交互式环境。 ②浙商证券发布研报表示，随着海外厂商持续加速多模态AI领域布局，多模态AI新一轮浪潮有望加速到来。

据媒体报道，谷歌定义了生成式AI的全新范式——生成式交互环境（Genie，Generative Interactive Environments）。Genie是一个110亿参数的基础世界模型，可以通过单张图像提示生成可玩的交互式环境。GenieAI是一个利用互联网视频训练的基础世界模型，可以从合成图像、照片甚至素描中生成无限多的可玩(可控制动作的)世界。它的使用范围广泛，可以用于从图像或文本生成整个互动世界，是训练未来通用AI代理的有利工具。

浙商证券发布研报表示，近日英伟达宣布成立GEAR实验室，布局多模态AI以及具身智能领域，另外Stability.ai发布了具备更强文生图能力的Stable Diffusion 3模型，并宣布文生视频应用Stable Video开放公测。随着海外厂商持续加速多模态AI领域布局，多模态AI新一轮浪潮有望加速到来。

据财联社主题库显示，相关上市公司中：

因赛集团的InsightGPT具备文生文、视频智能剪辑、图生视频等功能，目前正在开发文生视频功能。在现有图生视频等技术框架下，InsightGPT目前可生成20秒以上的视频。

万兴科技的天幕大模型具备多媒体、垂直解决方案、算力数据及应用本土化等特色，以更智能、更沉浸的功能效果和产品体验赋能全球内容创作者的创意表达。

风险提示：本文所有观点不构成任何投资买卖建议，据此入市风险自负。股市有风险，投资需谨慎！