转自:金融界
本文源自:金融界
金融界2024年6月14日消息,天眼查知识产权信息显示,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、相关设备及计算机程序产品”,公开号CN202410541327.3,申请日期为2024年4月。
专利摘要显示,本申请公开了一种语音识别方法、装置、相关设备及计算机程序产品,提供了一种基于转置的自注意力机制,可以先从第一维度(可以是通道维度或时间维度)对声学特征进行自注意力机制计算,对结果进行转置处理,之后沿第二维度(可以是时间维度或通道维度)对转置结果再次进行自注意力机制计算,从而实现了同时在通道维度和时间维度上通过自注意力机制进行建模,更好地进行多通道信息的融合,提升多通道语音识别效果。进一步地,本申请基于多通道语音信号进行端到端的语音建模,与传统方案对比不需要将多通道语音信号融合成单一通道语音信号,因而不会存在语音信息的丢失,进一步提升了多通道语音识别效果。
MACD金叉信号形成,这些股涨势不错!
海量资讯、精准解读,尽在新浪财经APP
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)