来源:DeepTech深科技
NEXA AI 创始人兼首席科学家陈伟(斯坦福博士生)、NEXA AI 联合创始人兼首席技术官李志远(斯坦福毕业生)担任论文作者。
![图 | 从左到右:李志远、陈伟(来源:资料图)](http://n.sinaimg.cn/sinakd20240620s/199/w1080h719/20240620/2437-e14f14641f929e33697c915f481d277a.png)
目前,Octopus 模型已能适配 Android 系统,涵盖打电话、发短信、设置闹钟、拍照等数十个常用功能。
研究团队计划进一步扩展到车载系统、智能家居等更多领域。
同时,他们也在探索多模态交互,让 Octopus 不仅能听懂语音指令,还能通过图像、视频等方式感知用户需求。
从更长远来看,他们希望让 AI Agent 走进各个行业和每个端设备。而这需要进一步赋予模型以学习、推理、规划等高层次能力,这也将是他们下一步的努力方向。
参考资料:
1.https://arxiv.org/abs/2404.01744
2.https://huggingface.co/NexaAIDev/Octopus-v2
运营/排版:何晨龙
![新浪科技公众号 新浪科技公众号](http://n.sinaimg.cn/tech/content/tech_qr2x.png)
新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
![](http://n.sinaimg.cn/tech/content/tech_weixin2.png)