曾经在AI大模型布局上相对“佛系”的小米,开始加快步调了。最近,小米砸下了高昂年薪,招揽了一位AI行业大牛加入。
12月20日,据第一财经消息,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加入小米,她或供职于小米AI实验室,领导小米大模型团队。
知情人士透露,雷军对小米在大模型领域发力太晚感到担忧,于是亲自下场挖人,罗福莉的薪酬水平或在千万元级别。
另据12月26日界面新闻报道,小米正在着手搭建自己的GPU万卡集群。而小米大模型团队在成立时已有6500张GPU资源。
种种迹象表明,未来一年,小米要对大模型大力投入了。
01、罗福莉何许人也?
12月初,小红书博主AI Dance就曾透露,雷军近期亲自交流或面试了多家LLM(大型语言模型)公司的CTO和核心算法人才。
被雷军重金招募的罗福莉,在大模型圈内被冠以“95后天才少女”的头衔。
罗福莉硕士毕业于北京大学计算语言学研究所。2019年,因研二在NLP(自然语言处理)国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,曾登上知乎热搜。彼时,常在知乎下场回答问题的罗福莉,也一夜成为“知乎红人”。
硕士毕业后,罗福莉顶着“ACL8篇论文作者”的光环,加入了阿里达摩院机器智能实验室。这期间,她主导开发的多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。
2022年,罗福莉离开阿里达摩院,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。此后,罗福莉加入DeepSeek,担任深度学习研究员,并参与了MoE大模型DeepSeek-V2的研发。
罗福莉加入小米,不仅因其过硬的技术实力,她身上“天才AI少女”“95后AI萝莉”的标签,也很符合“营销天团”小米的调性。
今年5月,在DeepSeek-V2模型发布后,罗福莉在知乎上回答了如何看待该模型的问题。她称DeepSeek-V2与GPT4的价格相比,是“性价比之王”。这样“接地气”的互动,与小米的风格,可以说颇为契合。
罗福莉将加入小米的消息,印证了小米将在大模型领域加码的传闻。
2023年4月,小米在AI实验室中组建起大模型团队。AI实验室主任王斌在同年11月接受媒体采访时,曾表示小米“不搞AI的军备竞赛”。“内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。”
当时,王斌还透露,“这个团队的目标还是通用语言大模型,第一步的目标基座模型参数在几百亿,然后会视前期爬坡结果,再决定下一步投入。”
与此相对的,是友商的步步进击。2023年11月的vivo开发者大会上,vivo发布了自研十亿、百亿、千亿三个参数量级,由5款语言大模型组成的蓝心大模型矩阵。
对于“烧钱”的预训练大模型,小米相较于其他厂商更显谨慎。
2023年年度演讲中雷军公开表示:“我们做大模型的思路可能和很多公司不太一样,我们选择主力突破的是轻量化和本地部署。”
这也是同步还在造车的小米,要优先保住“现金王”在成本上的考虑。
云侧的大模型在保证巨大算力的前提下,要根据调用付费,成本极高。而端侧大模型在本地运算,如果将大部分AI推理场景放在端侧,能够大量节约云端算力开支。
对于一贯注重产品的小米来说,小米用户在芯片性能、摄像头技术、屏幕显示等方面有着相对更高的需求。因此,尽管端侧大模型在效果上难以媲美云端,但其在隐私保护、低延迟和成本控制方面的优势,也能为其产品“性价比”提供保障。
但随着各家厂商芯片算力的不断提升,AI Agent与手机硬件的融合已势不可挡。AI Agent 在人机交互中,能更精准地理解用户需求,更高效地完成任务。
特别是,随着国产手机价格迈过4000元大关,有无AI的加持,将成为区别手机高低端的关键。IDC预测,2025年中国新一代AI手机市场出货量将达1.18亿台,同比增长59.8%,整体市场占比达到40.7%。
在这一背景下,小米手机如果不在AI上挖深护城河,其高端化战略必将面临巨大挑战。
02、小米大模型为何先发后至?
据媒体消息,这一次雷军正是出于小米在大模型领域发力太晚的担忧,才亲自下场招揽人才。看起来,雷军已经开始开始担忧,小米对大模型的“激进程度”,不及友商的决心坚定。
今年年底,各大手机厂商的旗舰机发布会上,AI能力的介绍都占据极大篇幅。vivo不遗余力地宣传蓝心大模型,荣耀CEO赵明更在发布会上,让AI Agent现场点咖啡。
小米在自家手机的AI能力宣传上,显得低调了许多。小米15的新品发布会上,其AI功能更多是常规的AI写作、AI识音等功能。在讲解上,小米也将焦点更多聚集于性能车SU7 Ultra上,对大模型和AI能力的介绍略显平淡。
这也让市场产生许多猜测:小米手机的AI能力到底够不够硬核?
事实上,小米在AI布局有天然的场景和必要性。除了手机,小米还是全球最大的IoT设备制造商,旗下有诸多设备可以连接“小爱同学”智能体,也可供信息收集和场景联动。
此外,小米还有自研系统澎湃OS,未来又面临着“人车家”全生态布局。对于小米来说,大模型的难点或不在于认清其必要性,更多在于大模型要如何与小米产品,以及不同体系生态充分融合。
事实上,小米发力AI的时间并不算晚。2023年8月的年度演讲中,雷军表示,小米从2016年7月就开始布局AI。
2017年,小米正式成立AI实验室,当时团队仅有4人,仅用4个月就上线了小米第一代语音识别系统,并公开了在电视语音交互中端到端语音识别的研究成果。彼时,小米将其定义为中文端到端语音识别技术最好的识别率,语音助手“小爱同学”也同步上线。
自此,小米在AI领域的研发投入不断加大。2019年,小米开放了人工智能平台,开发者可使用小米的AI技术,开发和发布应用程序。
2020年,雷军在小米内部信中宣布,下一个十年,小米的核心战略升级为“手机×AIoT”。
此后,小米发布了自研芯片澎湃C1、成立自动驾驶团队、小米机器人实验室,进一步深化在AI领域的布局。去年8月的年度演讲中,雷军表示,AI相关的团队已经超过3000人。
未来,随着罗福莉的进入,小米对AI的布局力度还会不断加大。
11月12日,小米大模型团队发布公告表示,小米大模型已升级至第二代。大模型在10大能力纬度上表现,相较于上一代平均提升了超过45%,同时丰富了参数矩阵,有从0.3B到30B多个参数规模,分别适配云边端各侧设备。
去年年底的“MEET2024智能未来大会”上,AI实验室大模型团队负责人栾剑曾表示,小米认为未来的设计中,云端大模型的结合必不可少。
而从第二代大模型的参数规模上看,30B量级已经能适应云端场景下的需求,具备相当坚实的zero-shot/上下文学习或一些泛化能力。小米对大模型的适配场景,也可以逐渐不再局限于端侧。
如今,随着罗福莉加入小米,也无疑将会为小米在大模型能力上,带来更多可能性。
文 |林北
编辑 |李不清
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)