在2024世界人工智能大会(WAIC)上,上海岩芯数智携Yan1.2多模态大模型亮相,不仅可以让大模型在手机、电脑、甚至树莓派端无损运行,还可以让机器人准确理解用户的模糊指令和意图。
现场,研发团队展示了一款部署Yan1.2多模态大模型的智能机器人“小智”,它能够基于Yan1.2的语音和视觉处理能力,实时识别环境、准确理解用户的模糊指令和意图,并据此控制其机械躯体高效完成各类复杂任务。值得一提的是,“小智”机器人搭载的核心硬件是以低算力著称的树莓派第五代芯片。在极低算力的设备上实现了强大的多模态能力。
![智能机器人“小智”](http://n.sinaimg.cn/spider20240708/136/w406h530/20240708/aec9-2a92dab29c4bc8700bcba5f6b706ec2a.jpg)
比如,“小智”可以根据“让一让,我要放东西”的模糊指令,识别其意图和行动方向,从而做出相应的避让动作。当有人问“小智,你现在看到了什么”或手捧书籍邀请“小智”一同看书时,它能够基于多模态能力进行学习和创作,精确描述环境和人物特征、学习书籍信息。
![新浪科技公众号 新浪科技公众号](http://n.sinaimg.cn/tech/content/tech_qr2x.png)
新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
![](http://n.sinaimg.cn/tech/content/tech_weixin2.png)