中国电信发布语音识别大模型,支持30种方言混说

中国电信发布语音识别大模型,支持30种方言混说
2024年05月25日 16:20 每日经济新闻

每经记者 杨卉    每经编辑 董兴生    

5月25日,《每日经济新闻》记者从中国电信获悉,中国电信人工智能研究院(TeleAI)于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语音识别大模型。

据悉,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,研发团队采用的“蒸馏+膨胀”联合训练算法可解决超大规模多场景数据集和大规模参数条件下预训练坍缩的问题,实现1B参数80层模型稳定训练。中国电信方面表示,星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率大幅降低。

据中国电信方面透露,星辰语音大模型现已对外开源及应用落地,在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。《每日经济新闻》记者还了解到,5月24日,第七届数字中国建设峰会在福州开幕,中国电信在峰会上发布了智算云能力体系,由算力基础设施、智算平台能力、星辰大模型能力、数据要素能力四部分组成。

大模型方面,除了上述语音识别大模型,中国电信还发布了星辰海纳视联大模型。据天翼视联科技有限公司总经理边延风介绍,天翼视联的视联网应用日益丰富,SaaS应用加载超1400个,openAPI月调用次数超30亿次。

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 05-31 达梦数据 688692 --
  • 05-28 利安科技 300784 28.3
  • 05-24 汇成真空 301392 12.2
  • 05-21 万达轴承 920002 20.74
  • 04-29 瑞迪智驱 301596 25.92
  • 新浪首页 语音播报 相关新闻 返回顶部