AI大模型狂潮之下,老炮和大牛们是如何攒局的?
作者 | 程茜
来源 | 智东西
智东西8月23日报道,过去三个月,生成式AI浪潮变数丛生,国内AI大模型产业也连爆大事:
6月29日美团宣布完成对AI大模型独角兽企业光年之外的收购,搜狗创始人王小川创立的AI大模型创企百川智能连发3款开源大模型;此前被光年之外收购的AI大模型创企OneFlow(一流科技)的创始人袁进辉也于本周证实,一流科技团队将瞄准大模型推理成本问题重新创业。
有趣的是,这些处于国内AI大模型竞赛焦点的主人公们——美团创始人王兴、光年之外创始人王慧文、搜狗&百川智能创始人王小川、一流科技创始人袁进辉——都是清华学子。
在如火如荼开展的AI大模型竞赛中,清华学子可谓“抢尽”了风头,除了王慧文、王小川等互联网“老炮”高调入场外,还有多位清华学院派教授、清华毕业生躬身入局。据智东西不完全统计,近期活跃的AI大模型创企中,拥有清华背景的创始人至少有17位,涉及11家企业。清华系创业团队俨然正撑起国内AI大模型创业浪潮的半壁江山。
▲近期活跃在国内大模型浪潮中的清华系创企(整理自公开信息)
01.
大佬创业:90年代清华师兄弟
互联网“老炮”高调入局
很多年后,人们回忆起国内这场盛况空前的AI大模型创业潮时刻:有两个人的名字一定会率先浮现在眼前,那就是王慧文和王小川。就在今年2月和4月,这两位互联网老炮接连官宣创业,剑指大模型。
除了这些共同点外,王小川和王慧文这对师兄弟曾于1996、1997年先后毕业于清华大学。
1、王慧文:2个月成独角兽,没产品成最大隐患
最先官宣创业的是王慧文。2月中旬,王慧文6天连发5条朋友圈,从表明态度到“500万美元带资进组求组队”、发“AI英雄榜”,最终AI大模型创企光年之外成型。
王慧文的创业之路总能看到美团创始人王兴的身影。1997年,王慧文考进清华大学电子工程系,因缘际会与王兴成为上下铺兄弟。戏谑的是,他们二人形影不离的原因是,成绩优异的王慧文进入清华大学后发现在众多佼佼者中自己只能算个“学渣”,因而与成绩相近的王兴惺惺相惜。
▲王慧文(右一)和王兴(中间)
毕业后两人几经波折,最终在美团“胜利会师”。读研期间,王慧文和王兴双双退学瞄准了彼时在美国兴起的社交网络,打造出风靡大学生群体的校内网后陷入商业化困境,随后选择出售校内网实现财富自由,两人分开创业。2010年,王慧文加入美团,再次与王兴联手。2020年,42岁、身价120亿人民币的王慧文选择从美团退休。
这次,王慧文又出山,入局AI大模型。官宣创业后,顶尖人才、高额融资纷至沓来。前有北京智源人工智能研究院副院长刘江、被称为“搜狗输入法之父”的马占凯等加入,后有王兴、快手创始人宿华掏钱投资。成立两个月后,光年之后迅速跃升独角兽,估值达10亿美元。
这背后,不是技术出身的王慧文开始紧锣密鼓地召集人才,4月,光年之外完成收购同为清华系创企一流科技。这家创企的创始人是师从中国人工智能奠基者张钹院士的袁进辉。
在此之后,手持丰厚资本、技术的光年之外业务布局即将走上正轨,成为AI大模型创业焦点的王慧文,6月底之际却被曝出已经因病离岗,随后,王兴入局,光年之外被美团全权收购。
目前来看,王慧文的AI大模型创业之路已经画上了终局,此后他是否会重返“战场”仍是个未知数,但成立半年之久的光年之后在产品端尚无进展官宣的当下,就几经波折,这或许已经成为这家头顶数道光环的大模型创企的最大风险。
2、王小川:百余天官宣3个大模型,投资阵容豪华
反观与王慧文受关注度几乎持平的王小川,4个月时间就拿出三款大模型,并开启了大模型商业化的探索。
鼎鼎有名的清华大学计算机系的96级毕业生,是国内互联网产业第一波弄潮儿,他们参与并见证了中国互联网发展的每一个时刻,堪称“互联网梦之队”。王小川就是其中之一。
▲百川智能创始人兼CEO王小川
1996年,因获得国际奥林匹克信息学竞赛金牌的王小川被点招入清华大学计算机系,这一待就是七年。从计算机专业到生物方向,从国内青年社区平台ChinaRen到搜狐,王小川的技术才华施展的范围逐渐扩大,但他的物理空间却几乎没有离开过五道口,王小川也被称为“清华东门守门员”。
王小川也把百川智能安家到了五道口。今年4月,王小川联手前搜狗COO茹立云成立百川智能,官宣入场大模型创业,更有多位搜狗团队老员工主动申请带资加入,据王小川在第三个大模型发布时透露,目前百川智能中前搜狗员工的比例占到30-40%。
成立一个月后,百川智能就拿到了来自腾讯、小米、金山、清华大学资产管理有限公司、好未来等十余家机构的联合投资,这样的豪华投资阵容鲜有先例。
四个月时间,百川智能已经发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本、530亿参数规模的Baichuan-53B,覆盖开源到闭源。下一步,王小川要在大模型开源的基础上,以搜狗曾经的超级应用经验为基础,找到大模型的超级应用以及比肩GPT能力的大模型。
▲百川大模型演示案例
王慧文、王小川都是曾经缔造中国互联网的清华学子,隐退多年后,又在大模型浪潮下躬身入局。除了这两位互联网老炮外,还有众多清华系教授、学生在这场硝烟弥漫的大模型赛道中格外扎眼。
02.
学院派:五位教授领衔
孵化多个大模型创企
清华大学当之无愧是国内AI大模型赛道的人才宝地,现有的学术力量风头正盛,五位教授领衔的AI大模型创业浪潮正在徐徐拉开帷幕。
在人工智能领域,不得不提的就是智源研究院这一响当当的名头。2018年,智源研究院正式成立,将北京大学、清华大学、中国科学院、百度、字节跳动等人工智能产业的头部院校、企业的顶尖人才聚集到一起。
当OpenAI的GPT-3发布后,智源研究院率先发起大模型项目,唐杰、刘知远、黄民烈、杨植麟……等清华大学知名AI学者纷纷投身其中,他们共同构成了后来悟道大模型的研发团队。
这些AI大牛也成为了这波大模型创业浪潮中的核心力量。
1、唐杰:核心成员曾参与知名大模型研发,融资拿到手软
智谱AI、智源研究院、月之暗面、循环智能,这些身处大模型热潮中心的公司,都与清华大学计算机系教授唐杰关系匪浅。
唐杰教授光环加身,他既是清华大学计算机系知识工程实验室(KEG)带头人,同时是智源研究院学术副院长、悟道项目负责人。
▲唐杰(图源:清华大学)
事实上,最开始唐杰并不相信机器智能会超越人,他的主要研究方向是数据挖掘和知识工程,而大规模预训练模型的出现,让他看到了机器智能超越人的可能性。
2020年OpenAI甩出GPT-3,搅动了整个人工智能产业。随后,2020年10月,智源研究院率先确定了大模型研究战略方向,时任智源副院长的唐杰带领团队在2021年发布了悟道1.0和2.0模型。同时,悟道2.0凭借万亿级参数规模创下中国首个、全球最大的世界纪录。
与此同时,KEG实验室孵化的智谱AI,其核心团队也多为悟道大模型的研发人员,今年7月,刚刚收购光年之外的美团独家投资了智谱AI,融资金额达数亿人民币。目前,智谱AI中英双语开源模型ChatGLM、代码生成模型CodeGeeX等大模型及应用产品矩阵。
除唐杰本人外,他鼎鼎大名的得意门生杨植麟也入局大模型,从清华毕业的杨植麟在美国卡内基梅隆大学师从苹果和谷歌的AI大牛。6月12日,杨植麟剑指大模型的新创企月之暗面亮相,刚成立就迅速拿到红杉、真格机构投资,市场估值达3亿美元。不过,杨植麟头顶的光环远不止于此,早在2016年,杨植麟就创立了专注于自然语言理解的循环智能,还曾参与华为盘古大模型研发。
月之暗面其他三位联合创始人中张宇韬和周昕宇也毕业于清华,张宇韬与杨植麟同为唐杰的学生。
2、孙茂松:从信息处理到法律大模型,创企数量、涉足种类都处前列
清华大学人工智能研究院教授孙茂松是自然语言处理与社会人文计算实验室(THUNLP)的负责人,刘知远师承孙茂松。相比于唐杰教授,孙茂松和刘知远团队的创业公司更多,并且涉足的应用领域也更丰富。
▲孙茂松(左)刘知远(右)
深言科技基于预训练模型打造中文信息处理引擎、面壁智能聚焦于基础大模型的核心技术、幂律智能则要将自然语言处理应用于法律。此前,王慧文还曾传出要收购深言科技和面壁智能,但这些收购传闻最后都不了了之。
2021年,一款名叫WantWords的反向词典突然在社交平台上爆火,两三周时间吸引了约30万用户。这一应用的研发人员就是后来深言科技的创始团队。WantWords基于深度学习能帮助人们根据语义描述查找词语,这一产品也帮助岂凡超打响名号。
▲WantWords反向词典主页
早有创业想法的岂凡超,2022年毕业成立了深言科技,孙茂松担任首席科学家,并且深言科技的核心团队均为清华硕博士背景。成立至今,深言科技已完成三轮融资,最新一轮融资中腾讯、好未来在列。尽管具体的融资金额尚未披露,但据传其估值在第二轮融资完成后已达1亿美元。
另一家被传收购的面壁智能,创始人曾国洋是刘知远的学生,同时刘知远担任联合创始人,面壁智能已经完成近千万元的种子轮融资,此前推出了CPM-Live百亿中文大模型直播训练项目。
今年4月,知乎宣布与面壁智能共同开发了“知海图AI”,并为其注资数千万人民币,这也一举打破了面壁智能曾被收购的传言。技术、人才、资本、应用、数据等多重因素的加持,使得面壁智能的大模型已经在知乎的应用实现大规模应用。
除了这两家创企,还有清华大学计算机系人工智能所博士涂存超成立的幂律智能,这家公司关注的是自然语言处理技术与法律领域的结合。今年6月,幂律智能联合智谱AI发布了基于中文千亿大模型的法律垂直大模型PowerLawGLM。
3、黄民烈:瞄准心理咨询具体场景,要做中国版Character AI
同样参与悟道大模型研发的清华大学计算机科学与技术系长聘教授黄民烈,在创业初期就瞄准了具体的应用落地场景。
2021年,黄民烈教授创立了聆心智能,其创始团队多来自于清华大学、北京大学、北京师范大学等高校科研院所,截至目前,聆心智能已经完成三轮融资,投资机构包括清华系的智谱华章等,其中披露具体融资金融的为去年12月完成的数千万元天使+轮融资。
▲清华大学计算机科学与技术系长聘教授黄民烈(图源:清华大学人工智能研究院)
创立初期,黄民烈教授就专注于让人工智能能为心理亚健康患者提供病情诊断、个性化干预的方案。这一创业目标的想法来源于黄民烈教授与其身患抑郁症学生的故事。
今年7月,聆心智能发布了超拟人大模型CharacterGLM,提供千人千面的AI形象来陪伴用户、与用户聊天等,基于这一大模型,聆心智能还正在内测用户兴趣互动社区新产品AiU。
与这波大模型浪潮中瞄准OpenAI的创企不同,聆心智能此前曾透露,他们要做的是“中国的Character AI”,Character AI的最大特点就是让用户创建个性化的AI角色来进行交互。
4、朱军:主攻多模态大模型,拿到蚂蚁、百度风投投资
清华大学计算机系教授、清华大学人工智能研究院基础理论研究中心主任朱军也是最新入局的一位清华系教授。生数科技成立于今年3月,其核心团队大多来自清华大学人工智能研究院,主要打造多模态通用大模型。
▲清华大学计算机系教授、清华大学人工智能研究院基础理论研究中心主任朱军(图源:北京智源大会官网)
朱军教授第一次创业可以追溯至2018年,彼时专注于提升人工智能安全性的瑞莱智慧RealAI成立,专注于提升人工智能的安全性。
生数科技正是由瑞莱智慧孵化而来,成立至今拿到两轮投资,今年6月拿到蚂蚁集团、BV百度风投等的近亿元人民币融资,今年8月拿到锦秋基金独家投资的数千万人民币。
生数科技联合创始人兼CEO唐家渝还是孙茂松教授的学生,他此前在接受采访时谈道,生数科技当前所训练的大模型图像生成效果已经超过Stable Diffusion,预计将于年内赶超Midjourmy。
5、周伯文:面向消费者业务,自研百亿级垂直大模型
最后一位与上述几位教授的情况略有不同,清华大学惠妍讲席教授、清华大学电子工程系长聘教授、清华大学电子系协同交互智能研究中心主任周伯文,是AI大牛重返学界的典型代表。
从IBM到京东,周伯文从事人工智能基础理论和核心技术研究已达20年。自从2003加入IBM,他连任多个大型项目重要技术、管理职位,还作为IBM Watson集团首席科学家领队开发了IBM Watson集团人工智能平台。2017年加入京东后,又成为推动京东人工智能、京东云发展的重要人物。
▲清华大学惠妍讲席教授、清华大学电子工程系长聘教授、清华大学电子系协同交互智能研究中心主任周伯文(图源:启明创投)
2021年,他从京东离职后,2022年中旬,清华大学官宣聘任周伯文。
除了重返学界外,周伯文也瞄准了AI创业这条路。2021年,衔远科技成立,这家公司的核心产品瞄准的是消费行业,提供基于商品供应链大模型的企业级多轮对话平台ProductGPT。并且,该公司的信息显示,这一AI大模型是其自研,参数规模为数百亿级,能让大模型在具备通用能力的基础上更擅长理解人与商品。
清华大学的学术力量已经站上大模型创业的擂台,既有清华教授下场创业,又有师生搭档入局。事实上,在国内的创业大潮中,清华帮已经不止一次撑起产业的半壁江山,而这都离不开上个世纪清华大学在人工智能领域的前瞻布局。
03.
从0开始迎头赶上
清华大学撑起大模型创业半壁江山
清华大学,这一所汇聚了国内众多顶尖人才的高校,也是中国人工智能技术萌芽诞生的地方。
相比当下的火热程度,40多年前“人工智能”这个词汇在国内的专业人士眼里也很陌生。1978年,人工智能第一次出现在了清华大学内部,自动控制系更名为计算机技术与应用系,内部人工智能与智能控制教研组成立,拉开了人工智能领域的教学序幕。
清华大学也创下了全国人工智能领域的多个第一,1978年招收第一批硕士生;1983年成立首个智能机器人实验室;1983年在国际人工智能大会(IJCAI)上发表我国第一篇学术论文;1984年获得人工智能领域的第一个国际重要奖项;1987年第一位人工智能领域的博士生毕业;1990年成立全国第一个有关人工智能的国家重点实验室“智能技术与系统”;2005年“清华大学计算机科学实验室”成立,也就是当今人工智能领域无人不知的“姚班”;2018年成立跨系交叉研究机构“清华大学人工智能研究院”……
我国逐渐在人工智能领域里赶超世界领先水平,并占据一席之地。
然而,寥寥数语始终无法完全概括清华大学从一片空白到如今硕果累累的不易。上个世纪七十年代,中国人工智能领域生物控制和模式识别等方向的研究已开始起步,但受政治环境等影响,人工智能的研究一定程度上来说处于停滞状态。
国内求学无门的研究人员为了更全面系统地认识人工智能领域,改革开放后赴美求学,40多岁的张钹就是这批留学生中的一位,他作为访问学者前往美国伊利诺伊大学香槟分校进修学习,国内NLP研究奠基人黄昌宁在耶鲁大学进行了为期一年的访问。而他们都成为了我国人工智能产业的重要奠基人和推动者。
▲张钹院士在计算机系建立六十周年致辞(图源:清华大学)
总的来看,我国人工智能研究起步比国外晚了20多年,经历了从无到有、从弱到强的发展历程。如今,国内人工智能产业的发展已经与其他国家几乎处于同一起跑线,清华系的创业者作为这一波大模型浪潮中的中坚力量,凭借前人在人工智能领域的奠基、自身过硬的技术积累以及对前沿技术的探索、求真精神,正在从象牙塔走向练兵场并迅速成长。
04.
结语:清华创业帮蓄势待发
清华大学可以称得上国内人工智能研究的起源地之一,在这一波人工智能新浪潮下,清华系无疑被寄予厚望。
除创业势头迅猛外,资本市场也选择重金押注清华创业团队,4月,深言科技新一轮融资完成后最新估值达1亿美元,6月生数科技完成近亿元天使轮融资,腾讯被曝今年6月向光年之外投资5000万美元……
如今,大模型创业浪潮已经渐趋冷静,众多清华系创企已经竞相官宣大模型成果,并投身到大模型应用落地中。中国大模型创业者们的新一轮竞赛已经开始,并且愈发激烈。
如今,清华大学的优势逐渐凸显,不仅成为大模型领域的人才军备库,同时占据了国内大模型创业浪潮的半壁江山。
参考资料:计算机系建立六十周年致辞《与计算机系共同成长》
(声明:本文仅代表作者观点,不代表新浪网立场。)