阿里通义实验室最新发布了款ASR:Fun-ASR 1.5,核心能力:方言工业级可用
单模型即可无缝覆盖30种语言、汉语七大方言体系及20+ 地方口音,古诗词吟诵也能精准转写
典型方言场景CER相对上代下降56.2%,有5种方言准确率破 90%,15种超过 80%
从效果看,模型能还原方言特色词汇,比如上海话的"侬"、苏州话的"倷"
支持汉语传统七大方言体系(官话/吴/湘/赣/客/闽/粤),并深度适配20+地区口音官话
这就可以做来做方言文化纪录片制作、法律笔录等对文本规范性要求比较高的场景
其对古诗词的字符级准确率达到了97%,可以做国学课程、或有声诗词等场景
另外,支持同一段对话中30种语言跨语种混合自由切换
#ASR #FunASR