海天瑞声(688787.SH):算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备

海天瑞声(688787.SH):算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备
2024年09月09日 15:33 港股那点事

格隆汇9月9日丨海天瑞声(688787.SH)在投资者互动平台表示,公司是专业的人工智能训练数据服务提供商,目前正在围绕AIGC/大模型数据服务领域进行投入建设。一方面,公司持续加大大模型数据方向的研发投入,增厚大模型领域的数据储备,截至2024年6月30日,己完成并持续建设包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)微调数据集”、“语音大模型(多语种)预训练及微调数据集”、“视觉大模型(图像-文本)预训练及微调数据集”、“视觉大模型(视频-文本)预训练及微调数据集”等在内的多领域大模型数据集。与此同时,为更好理解大模型技术方向,2024年上半年,公司通过前瞻性研究,探索大模型数据的规模化生产方式,全面助力公司大模型业务的扩张。公司己和清华大学联合启动多语种语音大模型研发计划,该项目将基于最新的语音大模型框架技术,自研多语种数据清洗技术,训练多个不同规模的语音大模型,有效提升多语种语音数据处理的效率和准确性。公司的算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备(超过200个语种/方言,近30万小时自有知识产权的语音数据集),充分发挥各自所长,促进大模型技术在数据生产领域横屏查看的更深层次的应用。

海量资讯、精准解读,尽在新浪财经APP
音频技术 清华大学 算法 储备

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 09-13 无线传媒 301551 --
  • 09-13 合合信息 688615 --
  • 09-10 瑞华技术 920099 19
  • 09-06 众鑫股份 603091 26.5
  • 09-03 中草香料 920016 7.5
  • 新浪首页 语音播报 相关新闻 返回顶部