谷歌发布 Gemini 3.5 Live Translate：实现高保真实时语音互译

作者FinSage 2026年6月10日

谷歌近日正式宣布推出 Gemini 3.5 Live Translate，旨在提供极低延迟的实时语音到语音翻译体验。该技术不仅能够实现高效的跨语言交流，其核心突破在于能够精准保留原说话者的情感色调、语速节奏以及音高，使翻译后的语音在听感上与原主极其相似，极大提升了沟通的自然度和情感传递能力。

在技术原理上，Gemini 3.5 Live Translate 深度集成了谷歌最新的多模态大模型能力，通过端到端的语音处理架构，减少了传统“语音转文字 $
ightarrow$ 文字翻译 $
ightarrow$ 文字转语音”流程中的信息损耗和延迟。为了应对 AI 语音合成可能带来的安全风险及深度伪造（Deepfake）挑战，谷歌在所有生成的翻译语音中嵌入了 SynthID 数字化水印。这种不可见的水印技术能确保在保证用户体验的同时，使第三方工具能够识别出该音频是由 AI 生成，从而在安全和伦理层面提供必要的保障。

此举标志着谷歌在 AI 实时通信领域再次发力，不仅在技术层面挑战了同类产品的延迟表现，更通过对个体声音特质的还原，试图打破语言屏障带来的文化和情感隔阂，预计将广泛应用于国际商务、旅游及跨国远程协作等多种实际场景。

来源： ARStevechinca 报道 (作者：Ryan Whitwam)

科技新闻

比亚迪斥资20亿美元布局欧洲，推广“5分钟”超快充网络
作者FinSage 2026年6月10日

全球电动汽车巨头比亚迪（BYD）近日宣布了一项雄心勃勃的战略计划，旨在通过在欧洲全境部署“Flash Char…

阅读更多比亚迪斥资20亿美元布局欧洲，推广“5分钟”超快充网络
科技新闻

通用汽车押注钠离子电池，布局AI数据中心与电网储能新赛道
作者FinSage 2026年6月10日

通用汽车（GM）正计划将其在电动汽车领域的电池技术能力延伸至更广泛的能源基础设施领域。据 TechCrunch…

阅读更多通用汽车押注钠离子电池，布局AI数据中心与电网储能新赛道
科技新闻

npm v12 即将发布：重大破坏性变更预警
作者FinSage 2026年6月10日

知名 JavaScript 包管理器 npm 宣布即将推出 v12 主版本。由于此次更新包含多项“破坏性变更”…

阅读更多 npm v12 即将发布：重大破坏性变更预警
科技新闻

AI 助手进化论：在效率渴望与数字依赖之间寻求平衡
作者FinSage 2026年6月10日

在生成式人工智能（Generative AI）迅速渗透日常生活的今天，一个深刻的悖论正在用户心中生长：我们一方…

阅读更多 AI 助手进化论：在效率渴望与数字依赖之间寻求平衡
科技新闻

Siri AI 迎来颠覆性重构：从“语音助手”进化为真正的个人生产力工具
作者FinSage 2026年6月10日

在经历了初次 AI 升级的波折后，苹果公司再次对其智能助手 Siri 进行了深度重构。此次升级标志着 Siri…

阅读更多 Siri AI 迎来颠覆性重构：从“语音助手”进化为真正的个人生产力工具
科技新闻

AI数据中心能耗危机，推动通用、福特等车企集体进军储能市场
作者FinSage 2026年6月11日

随着人工智能（AI）算力需求的爆发式增长，全球AI数据中心正面临前所未有的电力供应压力。这种巨大的能耗需求不仅…

阅读更多 AI数据中心能耗危机，推动通用、福特等车企集体进军储能市场

发表回复取消回复

要发表评论，您必须先登录。