通义Fun-ASR 1.5上线:主打方言识别

通义Fun-ASR 1.5上线:主打方言识别

据 [动察 Beating](https://t.me/OneMillion_AI) 监测,**通义实验室于 4 月 20 日发布语音识别模型 Fun-ASR1.5**。目前,该模型已在 **阿里云百炼上线 API**,并在 **魔搭社区开放在线体验**。

## 一套模型覆盖多语言与方言长尾
官方表示,Fun-ASR1.5 采用**单模型**覆盖:

– **30 种语言**
– **汉语七大方言体系**
– **20 多种地区口音**

相较以往“按方言单独切模型”的做法,这一版不再需要为不同方言拆分多套识别链路,从而让整体部署更简洁。

## 内部评测:方言场景字错误率大幅下降
通义给出的内部评测显示,在典型方言场景下,Fun-ASR1.5 的表现较上一版有明显提升:

– **字错误率下降 56.2%**
– **5 种方言准确率超过 90%**
– **15 种方言准确率超过 80%**

此外,**古诗词识别**被单独列出并进行专项优化。官方提供的**内部字符级准确率为 97%**。

> 以上数据均来自通义自测,并非第三方基准。

## 对真实业务意味着什么?
在中文语音识别中,**方言长尾**一直是最难处理的部分之一。Fun-ASR1.5 的思路是:把这些长尾能力收进同一套可直接商用的能力体系中。

对于 **教育直播、地方政务热线、采访整理** 等场景而言,接入方可以不再为不同地区口音维护多套识别链路,部署成本与复杂度会相对更低。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/172540/

(0)
上一篇 10小时前
下一篇 10小时前

相关推荐