帝都、魔都双双押宝 年底了AI圈居然还有高手

帝都、魔都双双押宝 年底了AI圈居然还有高手
2024年12月26日 09:00 快科技

好好好,本以为 OpenAI 直播已经是 24 年 AI 领域的尾声,没想到还有高手,国内 AI 圈又传出个大新闻。

就在前几天,国产 AI 六小虎中的阶跃星辰,拿到了数亿美元的融资。

 而且更值得一提的是,这轮融资的背景可不简单,差评君还从投资方里找到了上海国资的身影。

要知道就在几天前,北京国资也投了六小虎中的另一家智谱。

 一南一北两大超级城市,各自押宝,都上了赌桌。

有一说一,经过前段时间的 “ 百模大战 ” , AI 在融资圈儿其实是有些降温的,结果这次两大国资先后出手:

这一波,难不成是大模型版的沪爷 VS 京爷?

虽然话是这么说,估计一些网友还是对 “ 阶跃星辰 ” 的名字有点陌生, “ 这又是从哪冒出的大模型公司? ” 

但其实在圈儿内,阶跃星辰早就小有名气,不过倒也不怪大家没听过,主要这企业确实比较低调。

相对其他AI 创业公司,阶跃是六小虎里最后出场的,但在登场时,就已经是独角兽的存在了。

如果要用一句话来形容的话,差评君能想到的就是 “ 低调神秘有实力,国资背景大牛多 ” ,是国产 AI 里的一匹黑马。

不仅在首秀时,阶跃星辰就掏出了个对标 GPT-4 的万亿参数模型,而且主打一个速度快、效率高, 10 个月内就发布 11 款模型,并且在 16 个月内,就捣腾出了从理解到生成的全系列模型矩阵。

 虽然人家确实挺有实力,不过咱这次的重点倒不是纯讲这个。

差评君觉得借着拿阶跃星辰融资这事,还是有挺多有意思的 AI 圈内故事,能和大家聊聊的。

首先不可否认的是,大模型领域实际已经在缩决赛圈儿了。

 差评君也和不少圈内人聊了聊,发现大家基本都在从两个点,来判断这家公司有无能吃鸡的冠军相。

一个是有没有牛逼的人才,另一个是能不能坚持投入技术研发搞 AGI 

咱先说人才,其实大模型的人才圈儿,可能比差评君的朋友圈还小。

 就拿今年诺奖得主乔弗里辛顿来说,他这个深度学习之父的实验室,一向就是各大公司眼中的顶级宗门。

像什么 OpenAI 联合创始人伊利亚,就是他的博士;谷歌 DeepMind 的大佬阿列克谢,是他的博士后;

Meta 的人工智能负责人杨立昆也是他的弟子;前百度首席科学家吴恩达,也跟他有千丝万缕的关系。

而在国内,被北京国资选中的智谱 AI ,实际上也是学术上的大宗门出身,直接来自有 27 年人工智能研究历史的清华大学知识工程实验室。

 所以说,有没有这些牛逼人才,往往是行业内认不认可一家公司的理由之一,甚至有时候请这些圈内大牛,要比花钱买显卡搞计算还重要。

前不久,差评君就和某大模型一线技术人员聊了聊,他用前不久字节高薪挖阿里通义大模型技术负责人周畅的新闻举例,告诉差评君目前圈内人才急缺。

 他觉得传闻中花费 8 位数薪资挖人的操作,是可以理解的。

因为大模型训练成本动不动就是几千万上亿,而合适的人才,能少走很多弯路,反而是最省的操作。

而这次的阶跃星辰,差评觉得它能被资本看好,也和人才脱不了干系。。。

不过与学院派京爷智谱不同,沪爷阶跃这方面也很特色,很多人都是行业内老人了。

 他们里面很多研究人员都是从读博士开始搞相关领域,然后在大厂工作过,亲身在一线经历了过去 10 年 AI 的最前沿发展。

比如阶跃星辰的创始人、CEO 姜大昕,这哥们以前是微软前全球副总裁,日活上亿、备受差友们喜欢的 Bing 搜索,还有全球最早的智能个人助理 Cortana ,都是他曾参与过的项目。

这么说吧,他把深度学习技术应用到了 Bing 上,帮助 Bing 搜索服务扩展到全球 200 多个国家和地区。

除了CEO ,阶跃的首席科学家张祥雨,在这个圈子里也很有名。

这老哥本来是西交跟微软亚洲研究院的博士生,师从孙剑和何恺明,还是开山大弟子。

 但这还不是重点,重点在于读博期间,他们师门四人完成了——引用次数几十万、本世纪最火的深度学习著名论文—— ResNet ( 残差学习 ),而张祥雨在里面就负责了底层框架和编码。

有的差友可能不了解这个 ResNet ,没关系,重点就一句话,这文章的核心思想残差网络,对现代深度学习影响巨大。

当年打败八冠王捷豹的 AlphaGo 系列,就用了 ResNet 技术;现在的 Transformer 网络( GPT 里那个 T  )里,同样也用了残差网络。

 除了这个,张祥雨在其他技术上也很牛逼,在这咱就不细说了。就说一个苹果的 3D 人脸解锁,也就是 FaceID ,那其实也是受他的 ShuffleNet 技术影响才搞出来的。。。

总之,这个 2023 年 4 月才建立的团队,在六小虎里亮相最晚,但人才的实力却丝毫不虚,从这点上看,能拿到魔都的投资也不算奇怪。

然而另一方面,除了人才以外,大模型厂商路线的选择,也越来越受重视。

 而 AGI 基座模型这方向,其实也是技术理想主义者们最兴奋的方向,是大部分创业者入局大模型领域的初心所在。

换句话说,基座大模型就是那一层地基,只有地基扎实了,模型的基础能力逐渐提升了,才有可能在未来搞出能真理解世界的通用模型,并运用到各种场景中改变人们的生活。

像是 OpenAI 、 Google 、 Anthropic 、 Meta ,还有国内的智谱、阶跃等,就属于这一派,在坚持推出各类 AI 应用的同时,也依旧在基座大模型的探索上越走越远。

然而就像开头说过的,整个 AI 领域其实有些降温。

 不少初创厂商们因为成本上的压力,逐渐搁置了基座大模型的研究和探索,把重心放在 AI 应用上。

要么转向垂直行业赛道、要么单纯搞 toC 的生意来赚钱,毕竟要先活着才能去实现理想。

而在 2024 年,国内依旧在不断更新基座模型,依旧在公开场合重申 AGI 为最终目标的公司里,智谱和阶跃星辰算是很典型的代表了。

 几个月前,差评编辑部就跟智谱的 CEO 张鹏对话过。张鹏表示:我们的目标定在 AGI ,这里面每一个问题的突破都有可能带来飞跃式的发展。

包括阶跃星辰也一样,阶跃的创始人姜大昕曾经说,高昂的训练成本的确是一个挑战。有人调侃 “ 讲卡伤感情,没卡没感情,用卡费脑筋 ” ,但如果追求的目标就是 AGI 的话,付出再多也还是要坚持下去。

姜大昕给阶跃星辰设计的技术路线中,就分成 “ 单模态 - 多模态 - 多模理解和生成 - 世界模型 -AGI” ,一共五个步骤。

这可能也是阶跃的大模型系列之所以被命名为 Step 的原因,五步成诗。

到了现在,阶跃星辰已经走出了两步。

阶跃的第一步,就是万亿参数大模型 Step-2 ,它在上个月就炸场了一番。

在图灵奖得主杨立昆亲推的权威榜单,有 “ 全球最难大模型评测 ” 之称的 LiveBench 上,Step-2 拿下了国内第一、总榜第五的成绩,成了唯?进?前?名的中国语??模型。

榜单成绩时间:2024-11-19

而阶跃的 “ 第二步 ”Step-1V 走的也不错。

拿?模型竞技场 Chatbot Arena 的数据来看,这个竞技场网站里网友们可以试用所有的大模型,然后给它们打分,今年 11 ?的榜单里 Step-1V 的总分已经达到了 Gemini1.5 的水平。

除了这些,在 C 端应用上这家公司也做出过一些出圈的产品,就比如主打拍照识别的跃问 app 。

他家的跃问拍照问,也是最早接入 iPhone 16 相机控制的国产大模型功能。

还有一上线就快速冲上 App Store 美食榜前三的胃之书,用的就是阶跃的多模态大模型;

今年在圈内爆红的AI 小游戏换你来当爹、灵魂提取器,也是基于阶跃模型能力开发出来的。

像是界面财联社这些财经垂类的专业媒体,也跟阶跃做过 AI 合作。

但归根结底,阶跃星辰给人最深的感觉,还是在低调有实力,和坚持着 AGI 初心这两点上。

而这,或许就是上海国资之所以选择它的另一个原因。

 最后,差评君觉得在 AI 领域逐渐降温的 2024 年末,智谱和阶跃星辰两家先后拿到了国家队的投资,这对国产 AI 行业来说也是一个比较重要的信号。

一方面,这意味着行业内的方向已经开始逐渐清晰,最顶端国家队的层面,也希望能尽快看到 AGI 。

而另一方面,这也可以说是拉开了国内大模型下半场的序幕:

拥有人才、找准方向、能坚持到最后的人,才有机会向人工智能的 One Piece —— AGI 进军。

AI差评深度学习
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片