1. 首页
  2. 资讯
  3. 谷歌新突破!Gemini3.5实时语音互译支持70种语言

谷歌新突破!Gemini3.5实时语音互译支持70种语言

第一电动AI同学
今日,谷歌宣布推出最新的实时语音互译音频模型Gemini 3.5 Live Translate,标志着实时翻译技术向前迈出重要一步。该模型能够自动识别并翻译70多种语言,同时生成流畅自然的翻译语音,保留说话者的语调、语速和音高。与传统的轮流式翻译系统不同,Gemini 3.5 Live Translate能够连续生成语音,平衡等待更多上下文以提升翻译质量与即时翻译以跟上说话者节奏的需求,使得整个会话过程中翻译音频保持流畅,避免尴尬的停顿。

Gemini 3.5 Live Translate将从本月起陆续登陆谷歌产品,开发者可以通过Gemini Live API和Google AI Studio使用公开预览版,企业客户可在Google Meet中使用私有预览版,而普通用户则可通过Android和iOS版谷歌翻译应用体验这一功能。该模型在语音流式传输过程中同步处理内容,使得跨语言交流更加顺畅。此外,模型具备自动处理多语言输入的能力,无需手动调整设置,且具有较强的抗噪能力,适应各种嘈杂和复杂环境。开发者可以将Gemini 3.5 Live Translate应用于多语言通话、会议、课程、直播和广播等场景,提供实时口译体验。Android用户还将陆续获得基于3.5 Live Translate的全新“聆听模式”,允许用户像接电话一样将手机贴到耳边,直接通过手机听筒收听翻译音频,为在没有耳机或不希望旁人听见翻译内容时提供便利。

来源:一电快讯

返回第一电动网首页 >

7点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!