Cartesia发布Sonic-3.5与Ink-2模型

2小时前 • 币资讯

Cartesia发布Sonic-3.5与Ink-2模型

23BTC 资讯速递自动整理 · 结构化解读

核心摘要

AI 语音模型初创公司 Cartesia 日前宣布推出两款新模型 Sonic-3.5 与 Ink-2，并基于二者构建统一的实时语音智能体技术栈。其中 Sonic-3.5 负责文本转语音（TTS），Ink-2 负责语音转文本（STT），开发者可通过单一 API 同时调用两款模型，实现端到端的语音交互能力。

正文解读

Sonic-3.5 主打实时低延迟语音生成，首音输出时间缩短至 90 毫秒。出厂即支持 42 种语言，无需额外预处理即可准确处理英文异音词及字母数字的发音。Ink-2 则将字错率（Word Error Rate）降至 3.6%，并引入了原生轮次检测（Native Turn-Detection）与噪声处理机制。与传统方案单纯依赖安静时长判断不同，Ink-2 能基于句意和语义理解判定用户是否发言完毕，从而提升对话的自然流畅度。目前 Ink-2 仅提供英文版本，多语言支持将在后续更新中推出。

要点

Sonic-3.5 首音输出 90ms，支持 42 种语言；Ink-2 字错率 3.6%，具备语义级轮次检测。
两款模型在设计上实现了双向流式协同，旨在减少因「多供应商拼接」带来的传输延迟与系统损耗。

随着实时语音智能体在客服、虚拟助手、语音交互等场景的应用加速，Cartesia 的一体化技术栈降低了开发者的集成复杂度，同时也对语音模型的端到端性能和多语言覆盖提出了更高要求。不过 Ink-2 当前仅支持英文，多语言版本的推出节奏将成为其能否在更广泛市场落地的关键因素。

原创文章，作者：admin，如若转载，请注明出处：https://www.23btc.com/190643/

赞 (0)

0

HYPE突破76美元创新高，24小时涨超12%

上一篇 2小时前

美股存储四小龙盘前齐创新高

下一篇 2小时前

币资讯

Peter Thiel减持ETHZilla股份1.9%

【突发：Peter Thiel旗下基金大幅减持ETHZilla股票，持股比例降至5.6%】 23btc报道，根据美国证券交易委员会(SEC)最新披露的文件显示，知名投资人Peter…

2025年11月15日
0
币资讯

币安BAS预TGE需213分

2025年7月17日
0
币资讯

马斯克盟友筹120亿投xAI芯片

2025年7月23日
0
币资讯

巴西副总统驳斥美关税传闻

2025年7月15日
0
Fjord Foundry将发布FJO代币，并进行空投，快照日期为3月22日。

【2024-03-29 09:08】据悉，LBP平台Fjord Foundry将于3月29日发布其原生代币FJO。具体LBP时间为4月16日下午11点至4月18日下午11点，LBP…

币资讯 2024年3月29日
0
币资讯

比特币矿工巨鲸抛售或预示“局部见顶”

2025年7月21日
0
Sui币价突破2美元

**Sui价格强势突破2美元大关，市场情绪与价格走势出现罕见背离** 根据加密数据研究机构Santiment的最新监测，Layer 1公链项目Sui（SUI）代币价格于周二成功突破…

币资讯 2026年1月7日
0
币资讯

嘉楠科技融资7200万美元

重磅！嘉楠科技完成7200万美元战略融资，三大顶级机构联手加持【区块链快讯】全球领先的加密货币挖矿技术企业嘉楠科技（纳斯达克代码：CAN）今日传来重大利好消息！ ▍里程碑式融资…

2025年11月7日
0
币资讯

太平洋投资管理公司警示：美联储会议或现政策沟通转向

23BTC 资讯速递自动整理 · 结构化解读核心摘要太平洋投资管理公司（Pimco）近日表示，即将召开的美联储议息会议不仅关乎利率决策本身，更可能成为政策沟通框架调整的重要节点…

4天前
0
5家知名做市商自8月3日以来共计将超过13万枚ETH直接或间接转入CEX。

【2024-08-05 19:16】23btc报道称，根据0xscope的监测数据，自8月3日以来，有5家顶尖做市商共计将超过13万枚ETH直接或间接转入CEX。具体来看，Wint…

币资讯 2024年8月5日
0