行业动态

360借单晋级为奇富借单 奇富科技露脸INTERSPEECH 2024大会 方言辨认技能全球抢先

  原标题:360借单晋级为奇富借单 奇富科技露脸INTERSPEECH 2024大会 方言辨认技能全球抢先

  INTERSPEECH作为全球语音科学界最负盛名的年度会议之一,汇聚了来自国际各地的顶尖学者、研究人员及职业首领,一起讨论语音技能的最新进展、应战与未来趋势。这一渠道不只代表了语音技能范畴的最高学术水平,也是新技能、新理念沟通与磕碰的绝佳场所,其威望性与影响力在业界无出其右。

  在讲演中,奇富科技介绍了可一起支撑20多种方言的新一代奇富语音辨认体系“QiFree”,这是国内金融职业界字错率最低的中文语音辨认体系。在中文口音与方言语音辨认范畴的威望测验集KeSpeech的比照中,奇富科技凭仗其在主动语音辨认(Automatic Speech Recognition,ASR)范畴的深沉堆集,完成了方言口音分类准确率的显着提高,达到了79.10%,远超KeSpeech的基线%,这一数据直观反映了奇富科技在语音辨认准确性上的杰出体现。一起,在衡量辨认错误率的要害目标——CER(Character Error Rate,字符错误率)上,奇富科技更是以8.08%的效果,远优于KeSpeech的10.38%,展现了其在中文方言辨认范畴的高效与精准。

  奇富科技自研的中文语音辨认体系“QiFree”,打破了单一模型只能辨认特定单一方言的窘境,经过立异的层自适应交融结构,凭借同享信息编码模块更高效的提取方言信息,完成了即说即译,逐步增强了语音机器人的实时交互才能。值得一提的是,“QiFree”不只在普通话辨认范畴的CER上坚持领头羊,更在冀-鲁、江淮、胶-辽、兰-银等多个方言区域的辨认功能上,比较过往最佳效果完成了超越15%的显着提高。这一突破性效果得到了INTERSPEECH三位独立审稿人的高度认可,他们共同认可奇富科技论文《Qifusion-Net:根据特征交融的流式/非流式端到端多口音语音辨认结构》所展现的体系结构立异性与辨认功能的杰出体现,并共同颁发其“ACCEPT”的鉴定。

  值得一提的是,在与国内一流公司(如某科技巨子及国内影响力最大的语音辨认开源社区)的比照中,奇富科技相同展现出了压倒性的优势。即便是在面临参数规划更大、练习数据量更丰厚的对手时,奇富科技仍然能以更低的CER(8.08%vs 15.61%vs 26.55%)锋芒毕露,证明了其技能架构的优越性和算法优化的高效性。此外,与全球抢先的语音辨认体系(如Openai-whisper v2)比较,虽然后者在通用言语辨认上具有十分显着优势,但在中文方言辨认这一细分范畴,奇富科技仍然坚持了显着优势,这进一步印证了其在方言辨认技能上的全球抢先地位。

  奇富科技在INTERSPEECH 2024上的再一次精彩露脸,不只是对其多年来在语音辨认技能范畴深耕细作效果的一次全面展现,更是向国际宣告了我国企业在这一范畴的强壮竞争力和无限潜力。奇富科技正以其杰出的技能实力和立异精力,引领着方言辨认技能的新一轮开展潮流,为全球语音通讯与信号处理技能的前进奉献着我国才智与我国力量。