5月20日,
谷歌在2026年I/O开发者大会上宣布了GeminiOmni模型的正式发布。GeminiOmni是谷歌DeepMind团队的最新成果,由诺贝尔物理学奖得主哈萨比斯(Demis Hassabis)领导,被描述为Gemini模型家族中能力最全面的版本。该模型能够处理文字、图像、视频、音频等多种模态信息,并在这些领域展现出前所未有的流畅性和深度。
GeminiOmni模型的核心特性是其“从任何输入生成任何输出”的能力,支持对话式编辑,允许用户通过简单的指令改变视频中的角色、背景等元素。谷歌还推出了GeminiOmni家族的首款模型GeminiOmniFlash,该模型即日起可在GeminiApp、GoogleFlow、YouTubeShorts等平台使用,未来还将推出API服务,以进一步扩展其应用范围。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。