“多语种智能语音关键技术及产业化”项目获国家科技进步奖一等奖

“多语种智能语音关键技术及产业化”项目获国家科技进步奖一等奖
2024年06月25日 17:22 媒体滚动

转自:经济参考网

  6月24日,2023年度国家科学技术奖在京揭晓,共评选出250个项目。其中,由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。

  据了解,多语种智能语音技术对于支撑人机交互、人类语言互通等具有重大战略意义,产业前景广阔。

  为解决语音识别研究中远场、噪声、多人语音混叠等难题,该项目提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,实现语音信号中内容、噪声等高度耦合的多维属性特征解耦,使得复杂场景下语音识别准确率得到重大突破。

  为应对小语种智能语音系统构建所面临的知识匮乏、训练数据稀缺等难题,科大讯飞设计了全新的多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建,又通过基于元学习的多语种预训练和基于语族分组的多语种共享建模。通俗地说,就是将不同的小语种进行分类,找到同类语种的共同规律,进行分析建模和训练,最终显著提升了小语种语音系统性能。

  同时,为解决复杂应用场景下语音交互、语音翻译面临着深层次语义理解困难、专业性不足等问题,科大讯飞提出语音语义互增强的鲁棒口语理解技术,有效提升语音交互、语音翻译等复杂场景的语义理解准确率;提出多源知识增强的可信文本生成技术,提升专有词汇及领域知识引用的准确率。

  目前,该技术成果得到广泛应用。以智能手机为例,项目支持各主流手机厂商累计激活设备超10亿台;智能汽车方面,车载智能化产品累计前装超5300万套。此外,该项目还构建了多语种智能语音技术及全球产业生态,2017年开始承建的智能语音国家新一代人工智能开放创新平台,已聚集平台开发者数700.7万,终端设备数40.5亿。

海量资讯、精准解读,尽在新浪财经APP
智能语音

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-01 乔锋智能 301603 --
  • 06-26 键邦股份 603285 18.65
  • 06-24 安乃达 603350 20.56
  • 06-17 永臻股份 603381 23.35
  • 06-17 爱迪特 301580 44.95
  • 新浪首页 语音播报 相关新闻 返回顶部