6月24日,2023年度国家科学技术奖在京揭晓,共评选出250个项目。记者了解到,由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。据悉,这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域的首个国家科学技术进步奖。
据了解,多语种智能语音技术对于支撑人机交互、人类语言互通及国家安全等需求具有重大战略意义,具有十分广阔的产业前景,是当前国际科技竞争的核心焦点之一。然而,智能语音也面临着如何突破复杂场景语音技术大规模实用门槛,如何基于自主可控的平台、实现国产软硬件的语音产业链自主可控等问题。
为解决这一技术难题,科大讯飞联合各单位、企业持续攻关十余年,通过提出复杂语音信号解耦建模技术、多语种共享建模技术、语音语义联合建模技术、国产异构硬件平台训练及推理加速技术等,实现了国产多语种智能语音的关键技术突破,构建形成了自主可控的智能语音技术体系。据悉,科大讯飞也是唯一获得本届国家科学技术奖一等奖的民营企业。
记者了解到,多语种智能语音技术是包含多语种语音识别、多语种语音合成、多语种翻译技术等在内的综合技术,也是新一代人工智能核心技术之一。目前,该技术支持全球69个主流语种,除了6个联合国通用语言(汉语、英语、法语、西班牙语、俄语、阿拉伯语)之外,还包括挪威语、丹麦语等小语种54个,均达国际通用标准。
如今,该技术成果不仅在博鳌论坛等重要政务和商务交流场合得到广泛应用,更在中国品牌“走出去”战略中发挥了关键推动作用。以近年来国产新能源汽车的海外出口为例,中国汽车出口企业十强中,有八家搭载了科大讯飞的多语种智能语音技术,涵盖23个语种,服务范围扩展至60多个国家和地区,为中国汽车行业的国际化进程提供了有力支撑。
记者了解到,近三年,多语种智能语音技术产业化项目累计实现直接经济效益521.28亿元,并带动由工信部和安徽省政府共建、以科大讯飞为核心的“中国声谷”产业集聚发展。
6月27日,讯飞星火V4.0也将正式发布,底座能力全面对标GPT-4 Turbo,语音大模型也将迎来全新升级。