北京时间10月10日,2024 vivo开发者大会于深圳国际会展中心正式开启,带来vivo全新升级的自研蓝心大模型、自然流畅,超有AI的操作系统OriginOS 5、自研蓝河操作系统2等重磅产品。
首日上午的VDC主题演讲结束后,vivo副总裁,OS产品副总裁,vivo AI全球研究院院长 周围、vivo OS产品总监 黄梓勋、vivo AI系统中心高级总监 熊官敬三人受邀出席媒体访谈会,共同回答媒体对于OriginOS 5系统、AI大模型、行业前景等方面的提问。
vivo在这次开发者大会期间正式发布全新30亿参数量级的蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型。相比蓝心7B,蓝心3B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA,内存占用仅1.4GB。
熊官敬介绍了30亿参数模型的优化过程。vivo研发团队从去年开始探索模型端侧运行极限,从1B、7B到 13B,后根据用户反馈和测试,考虑模型做小能力损失,最终确定3B模型能满足需求。通过芯片算力提升、计算加速优化和算法改进等措施,实现了模型性能和功耗的提升,今年以做行业最好的3B为目标,使其能在多个地方使用。
周围表示,今年重点推动大模型在端侧落地和与操作系统相互支持,先把 AI 手机体验做好,对未来变现持乐观态度,如快应用已取得营收和利润,对智能体时代的交互、分发、变现有信心。
2024年,各大手机厂商都将AI能力作为手机发展的重要方向,如何在保证隐私的安全的前提下将AI大模型与手机深度融合,对业界是一个巨大的挑战。周围表示,vivo研发团队的从单纯利用大模型的强大计算能力带来利益点,到如今要重新定义产品并深度重构手机系统,涉及审核端侧化、大量端侧模型化等多方面工作,工作量相当巨大。
为了实现更好的融合,vivo 在交互和数字世界重构上做出了诸多努力。黄梓勋提到,vivo目前的AI功能操作以长按、拖拽等方式实现,固然这些功能已经有友商使用过,但随着手机形态、交互方式的成熟,这些简单的操作也关联了一系列技术的体系的变革。
目前vivo的AI功能已经具有更丰富的功能,蓝心小V能听懂多种方言和语言并能表达。周围进一步阐述,在数字世界重构上,引入智能体,重构文生文、文生图编辑能力,构建意图洞察框架,开发 PhoneGPT 实现主动智能,让手机能像人一样操作并辅助决策。
周围表示,很多用户都AI的预期非常高,希望它能创作一些颠覆性的功能与场景,但vivo认为AI大模型时代并没有创造新的用户需求,AI还是用来赋能增强原有的用户体验,通过让交互更自然符合直觉,以及在场景感知、意图感知、主动决策和执行等方面提供支撑,如蓝心小V功能升级,从问答为主转变为能主动推测意图并提供选择,在此基础上,也会增加一些显性的功能,未来3-5年还会这么继续做下去。
整个手机市场在AI领域的竞争从去年就很激烈,难以做出明显差异化。不同厂商侧重点不同,vivo强调追求更自然、更符合直觉的交互,理解用户意图,帮助决策并执行实际操作,以此提升手机对用户的意义。
周围还透露称,vivo在AI硬件方面已有成果,如专门为视障人群打造的AI应用vivo看见在未来就可能推出眼镜等新品类,蓝河操作系统面向具身智能和智慧终端,已应用于手表等,未来将在IoT领域拓展。
vivo坚持自研大模型,从2018年投入AI团队,至今已经有小六年的时间,目前端侧化演进速度非常快,预计2027年整个端侧的算力可能就会很好地支撑自动执行的能力(PhoneGPT),预计2025年就会有强烈的感知。
黄梓勋认为,(AI功能)真正的痛点是在原有场景下给用户带来更好体验,新技术带来的新体验能让用户有快乐感或爽感,如蓝心小V等工具让用户习惯后难以离开。同时,从感性和理性角度追求更好的体验。尽管目前存在差异化困难,但vivo认为系统应具有思考和决策能力,让复杂技术简单易用,为用户提供更自然、更温暖、更智能、更舒适的体验。
PhoneGPT是vivo基于蓝心大模型技术做出的一次新探索,它获得标准体系下的四星认证,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。
熊官敬表示,PhoneGPT通过自研算子结构定义等方式优化,同时结合多种技巧解决问题。在APP弹窗等多任务干扰问题上,PhoneGPT也针对订餐等领域做了优化,未来将持续解决更多干扰问题。
作为行业首个全栈由Rust语言编写的操作系统,蓝河操作系统2最底层由vivo自研的蓝心大模型和VCAP推理计算加速平台构成,整合了蓝心大模型矩阵,支持不同参数蓝心大模型的灵活端云部署,并支持视觉、语音等多种AI算法。VCAP确保了各种AI算法在端侧的高效运行。
周围明确蓝河操作系统2“不做手机”,但有手机版用于训练。未来它还可用于单片机系统、摄像头、车机等。vivo对蓝河操作系统2的定位是面向智慧时代的智能终端,未来也将携手行业开放合作,共同探索蓝心大模型在机器人等AI设备上的解决方案。
vivo在AI与手机操作系统融合的征程中不断探索,通过应对挑战、发挥优势、参与竞争以及明确方向,努力为用户提供更优质的产品和服务,推动手机行业在 AI 时代不断向前发展。“我们希望手机使用体验是自然的,舒适的,给人智能温暖的感觉。”周围对vivo AI研发方向如此总结。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)