阿里巴巴发布Qwen系列新人工智能(AI)模型,公司称该模型可处理文本、图片、音频和视频,其效率足以直接在手机和笔记本电脑上运行。
该公司表示,目前公开发布于Hugging Face和GitHub的这个新模型将被用于构建所谓的AI智能体,例如,可以通过实时音频描述帮助视障人士确定他们周边的状况。
今年全力投身这项技术以来,阿里巴巴一直在以惊人的速度发布AI产品。
阿里巴巴当然不是唯一一家开发多模态模型的AI开发商。OpenAI和谷歌都提供了生成式AI工具,可处理包括文本和音频在内的不同类型输入。周二,OpenAI扩展其功能,为 ChatGPT新增更先进的图像生成功能。
阿里巴巴在声明中表示,其新的Qwen2.5-Omni-7B系统在语音理解和生成方面性能特别高。

海量资讯、精准解读,尽在新浪财经APP
责任编辑:李桐
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
