本报记者 孙奇茹
继上半年发布千亿参数模型Yi-Large之后,李开复带领的大模型公司零一万物对外发布最新旗舰模型Yi-Lightning,并对于坊间关于中国多家大模型企业已放弃预训练的传言进行了回应:“零一万物决不放弃预训练。”
在最新的国际权威盲测榜单LMSYS(由加州大学伯克利分校等国际知名高校合作创立)上,此次发布的Yi-Lightning刚刚超越了今年5月发布的GPT-4o版本及Claude 3.5 Sonnet,排名世界第六,中国第一。这也是在LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现超越OpenAI GPT-4o的成绩。
“如果真的计算中国赶超美国有多远的距离,至少零一万物只差五个月。”李开复说。不过他也提到,要进一步缩短时间差非常困难。
头部公司
资金和算力资源都不是问题
最近,在自媒体平台上,关于国内大模型创业公司AI“六小虎”(智谱、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰)有一些负面传言——称某几家已经放弃预训练模型,而是将业务重心转向AI应用,并称零一万物就是其中一家。
所谓预训练,指的是在特定任务上进行微调之前,对大语言模型进行的初始训练阶段。有业内人士比喻,预训练就好比大模型的基础教育阶段,赋予模型海量而通用的知识,是决定模型性能最关键的阶段,也是模型厂商最核心的技术壁垒。
在Yi-Lightning发布之际,李开复对“中国大模型行业将逐步放弃预训练”这一传言作出回应,表示不会放弃做预训练。他提出,做预训练通用大模型是一个系统性技术活,需要众多懂芯片、模型、推理、架构、算法的人才,做这件事的成本也非常高,不是每家公司都可以做成。“以后可能会有越来越少的大模型公司做预训练。”他判断。
不过李开复提到,据他所知,作为行业头部公司的“六小虎”均有足够的融资额度,都付得起预训练模型三四百万美元一次的训练成本,只要有足够好的人才和做预训练的决心,资金和算力资源不会是问题。
除零一万物外,百川智能近日也回应,并未停止进行预训练。
激活生态
顶级模型要做到“白菜价”
在攻坚大模型核心技术的同时,大模型行业的商业化落地无疑已成为多家大模型创业公司发展中的裉节。
长期以来,模型性能与推理成本之间的投入产出比一直是企业在选择大模型时必然要考虑的因素。李开复称,此次上线的Yi-Lightning的API(应用程序接口)定价至行业极低水平——每百万token仅需0.99元,但公司并非亏钱拉用户,而是有一定的利润空间。近两个月来,阿里云、智谱也陆续宣布对大模型降价。“世界顶级的模型做到白菜价,才可能实现通用人工智能普惠落地。”他认为,大模型只有实现高性能、白菜价,才能真正激活健康的生态环境。
在应用方面,李开复首次公布了零一万物企业级AI2.0数字人产品和落地进展。基于Yi-Lightning等模型其搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,其解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括餐饮连锁、酒旅类头部企业等。
例如,当某头部酒旅企业在接入Yi-Lightning加持的数字人直播后,数字人几乎能够以假乱真,对观众的弹幕问答能给出精准而有人情味的回应,其直播商品交易总额较此前上升170%。
业内共识
正从“拼参数”走向“拼应用”
随着中国大模型行业从狂奔进入到长跑阶段,如何让大模型技术走出实验室、走入实业助力新一波经济增长,成为关注点。
在上个月举行的外滩大会上,百川智能创始人王小川、MiniMax创始人闫俊杰、蚂蚁集团总裁兼首席财务官韩歆毅等人围绕大模型展开讨论时也达成了共识——大模型行业正从“拼参数”开始走向“拼应用”的节点,接下来行业面对两个问题,一是如何降低大模型的推理成本,进而推动大规模落地应用,二是如何用应用驱动技术发展。
目前,以“六小虎”为代表的不少国内大模型企业,仍在探索“技术+应用”两条腿走路。李开复透露,截至目前,零一万物企业级解决方案已在零售、医疗、教育等领域落地,涉及AI搜索、AI生产力工具、AI智能巡检等应用场景。百川智能则在医疗领域取得了进展,不久前与北京儿童医院等机构合作推出了儿童健康大模型。智谱CEO张鹏表示,智谱的企业级应用已经在金融、教育、互联网、零售等行业落地。
从Chat GPT的爆火至今,人们预期中的大模型“爆款”应用和爆发式的海量应用似乎都还没有出现。对此,百度创始人李彦宏近日表示,就像历史上许多次技术浪潮一样,在度过最初的兴奋阶段之后,泡沫不可避免。“生成式AI也会经历这一过程,泡沫过后,有1%的企业将脱颖而出。现在,我们只是在经历这个阶段,这个行业比去年更冷静,也更健康。”
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)