当前位置：首页 > news >正文

Google 推出 Gemini 3.5 Live Translate：打破「对讲机」式翻译，让对话无缝衔接

news 2026/6/12 0:57:12

Google 推出最新语音对语音翻译模型 Gemini 3.5 Live Translate，打破「等你说完再翻」老规矩，边听边译，输出连贯，还能保留说话者的语速、音高和语调。

打破传统翻译模式

过去的翻译机是「等你说完再翻」，节奏全断，像打对讲机。而 Gemini 3.5 Live Translate 边听边译，话音未落，译音先到，输出连贯，只落后说话人几秒。它基于 Gemini 3 Pro 打造，能吃进最长 128K token 的音频上下文。

多场景适用

该模型能认 70 多种语言，全自动识别，中途换语言也能跟上，环境吵也不怕。开发者可通过 Gemini Live API 和 Google AI Studio 公测上手，企业本月起在 Google Meet 私测，普通人在 Google Translate 的安卓和 iOS 版全球上线使用。

真实场景应用

Google 找了东南亚的 Grab 测试，司机说本地话，乘客能听到母语，每月超 1000 万次语音电话不再鸡同鸭讲。此外，CJ ENM、LiveKit 等公司反馈也很好，开发者接入 API 后可专注做体验。

二十年长跑成果

20 年前，Google 翻译只是小实验，如今每月为数十亿用户翻译超一万亿个单词。从文字翻译到实时语音翻译，走了整整二十年。不过，目前该模型也有局限，如只吃音频输入，声音复刻可能不稳。

语言沟通新趋势

同声传译正从顶尖译员的工作变成耳机里的功能，当语言不再是障碍，人和人之间的交流将更加顺畅。这或许只是起点，未来语言沟通会更便捷。

编辑观点：Google 的新翻译模型是语言科技的重大突破，虽有不足，但已能满足多场景需求，未来有望让跨语言交流像日常对话一样自然。

查看全文

http://www.cnnetsun.cn/news/2881689.html

OpenLayers 6 动态流动线效果实战：从静态GeoJSON到‘活’地图的保姆级教程

别再问怎么连PLC了！手把手教你用Python+SMLP协议读写三菱FX5U数据

2026视频转文字工具怎么选？免费方案+详细教程一看就会

AI动态简报之技术前沿篇（2026.06.11）

融合七普数据与WorldPop：ArcGIS实战人口栅格精细化修正指南

JSC低功耗SDRAM存储芯片DDR架构

MPC7455处理器热管理实战：从热阻计算到散热选型与验证

TrollInstallerX：iOS 14.0-16.6.1 系统上的高级越狱安装解决方案

深入解析MSC8156六核DSP架构：从核心设计到硬件实战避坑指南

ThinkPad开机卡顿？BIOS中Secure Boot与UEFI/Legacy设置实战解析

Claude 5 震撼发布并限时免费开放！实测最强 Mythos/Fable “神话级”模型，到底有多牛？

AI Agent在内容营销全链路的应用：从选题、创作到分发的自动化

AI 辅助的 API 接口 Mock 数据生成：前端独立开发的数据引擎

关于C语言的介绍

5分钟搞定黑苹果配置：OpCore-Simplify的智能革命

模拟CMOS 进阶解析——短沟道效应与FinFET工艺的博弈

从Kaggle经典赛题到实战：Rossmann销售额预测的数据探索与特征工程全解析

告别手动建模！用Gmsh Python API快速生成复杂三维网格（附完整代码）

从工艺文件到精准模型：EMX PROC编写与电感仿真实践

GitHub 7 月更改默认设置堵攻击途径，虽姗姗来迟但意义重大！

厂区内人员跌倒操作间工作间人员摔倒检测数据集VOC+YOLO格式2898张4类别

MySQL 存储引擎

AI 电动家用电器智能功率 MOSFET 完整选型方案

MRIcroGL：医学影像三维可视化的免费开源终极指南

3篇2章1节：医学综述的撰写临床综述的主要类型和分享 AI 辅助技巧

【网安利器实战】——Sqlmap进阶：从自动化注入到权限提升

DDrawCompat架构深度解析：DirectDraw兼容性革命与性能突破

从四色定理到算法实战：手把手教你用C++实现地图填色回溯法（附完整代码）

用Python+Requests+BeautifulSoup爬取Boss直聘岗位详情（附完整源码与防封策略）

别再只用vertical了！用Vue3写一个支持奇偶项错位布局的横向时间线（附完整源码）

打破传统翻译模式

多场景适用

真实场景应用

二十年长跑成果

语言沟通新趋势

相关文章：