科大讯飞申请语言模型训练方法专利,具有较低的内存需求和较低的流水空泡率

科大讯飞申请语言模型训练方法专利,具有较低的内存需求和较低的流水空泡率
2024年06月17日 16:50 金融界网站

转自:金融界

本文源自:金融界

金融界2024年6月14日消息,天眼查知识产权信息显示,科大讯飞股份有限公司申请一项名为“一种语言模型训练方法及相关装置“,公开号CN202410623693.3,申请日期为2024年5月。

专利摘要显示,本申请公开了一种语言模型训练方法及相关装置,涉及模型训练技术领域,训练方法包括:将语言模型部署于多个计算设备上,每个计算设备上部署语言模型的一个或多个层;获取训练样本集,训练样本集包括从训练序列集中获取的A个长度为S的训练序列;对训练样本集进行划分,得到多个训练样本子集,每个训练样本子集包括B个长度为S的训练序列,B小于A;对多个训练样本子集分别在序列维度进行切分,得到多个训练样本子集分别对应的子序列块集;利用多个训练样本子集分别对应的子序列块集中的各子序列块,采用流水并行的训练方式,控制多个计算设备进行模型训练。本申请公开的语言模型训练方法具有较低的内存需求和较低的流水空泡率。

MACD金叉信号形成,这些股涨势不错!
海量资讯、精准解读,尽在新浪财经APP
训练

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 06-24 安乃达 603350 --
  • 06-17 爱迪特 301580 44.95
  • 06-17 永臻股份 603381 23.35
  • 06-11 中仑新材 301565 11.88
  • 05-31 达梦数据 688692 86.96
  • 新浪首页 语音播报 相关新闻 返回顶部