股市瞬息万变,投资难以决策?来#A股参谋部#超话聊一聊,[点击进入超话]
原创:吴洋洋
来源:新皮层NewNewThing
‘技术发展太快了,需要留点时间讨论’
AI之所以值得关注,不止因为它是一类够fancy的技术,更因为它关乎我们人类的命运。我们将在这个“对话”栏目中推出一系列访谈,持续讨论“技术与人的未来”相关议题,访谈对象包括创业者、大公司主管、技术领袖、学者、律师、政策制定者、最早看到未来将改变的人以及那些被技术深刻影响的个体。
这是第一篇。为防止阅读时间过长,今天只发布上半部分,下半部分请关注明天的发布。
Key Points
2016年王小川就认识到,一旦机器掌握了语言,通用人工智能就来了。
上个时代还是信息时代,最多叫数据智能,我认为这次才真正开始进入到了AI时代。
(IBM的)Watson是要取代医生的,它失败了,因为它并不能通过一些考试,或者比医生干得更好。这次真的有机会了。
办公领域会出现“端到端”的行业结构,写文案这种中间过程的企业会消亡。
AI医生、AI教授、AI律师、甚至AI司机出现的时间不会太久,大概就3-5年。
比较成熟的领域已经有To C产品覆盖的时候,我们就做To B。但是对于增量的、大家没见过的产品,我们会做To C。
大语言模型已经被学界称为“foundation model”——基础模型。未来不仅是做机器人,还是做无人驾驶,都会基于这个基础大模型往上生长。
科技预言大师雷·库兹韦尔(Ray Kurzweil)说人工智能的奇点——机器智慧超过人类——会发生在2045年,王小川的判断比这更激进,他认为这一天会提早到2033年到来,理由是人工智能技术的迭代周期成倍递减:专家系统走过了40年,学习系统20年,深度学习10年,接下来,只需要再有5年、2.5年、1.25年、0.625年,转折点就会到来。
这个预测有待时间检验。如果预测成真,包括王小川在内的大模型(Large Language Models,大语言模型)创业者,就会是在飞船已经开始滑行才跳上甲板的人。
4月10日,王小川对外宣布成立百川智能,研发通用人工智能模型及应用。他搬回了旧部——大约一半百川智能的人来自原来的搜狗团队,还找到了5000万美元的启动资金。
留给王小川这样的创业者的时间并不多。王小川宣布上述消息的同一周,阿里巴巴在北京发布了其大模型“通义千问”。一个月前,百度发布了“文心一言”。前美团联合创始人王慧文所创立的光年之外,则已收购一家开发深度学习框架的科技公司一流科技OneFlow。
王小川已给出一个听起来激进的模型迭代计划:今年年中(大概一两个月后),他就要发布对标GPT-1的第一代模型;年底,对标GPT-3.5的模型就要推出。作为对照,从GPT-1到GPT-3.5,OpenAI花了四年多时间。
王小川本人并不认为这个计划激进,也不认为做出这个计划纯粹是出于竞争压力。“该不该做到和可行性上能不能做到是两个问题。”他说,从“应该”的层面,他判断大模型领域今年的竞争核心是能否成功构建基础模型,明年,市场就会进入对应用场景的竞争阶段。说到“可行性”层面,王小川表示自己并不是今年才开始做大模型,而是早在2021年他就在做大模型了。
“除了OpenAI,我并没有看到任何一个公司或者个人,特别国内的人,认为通用人工智能到来了。”王小川说,决定大模型及其应用胜负的,将会是“认知”。
我们同王小川聊了聊他对大模型终局的认知,他向我们描绘了医疗、教育、办公、自动驾驶等所有今天已有AI涉足的领域将会如何被大模型改变,也聊了当下阶段中国公司在开发基础模型上的共同挑战和可能的捷径,以及GPT的不足和留给后来者的创新机会。
持续的创业命题:为生命建立数学模型
新皮层:你宣布创立百川智能的时候写了封公开信,主要想传达什么信息?
王小川:我觉得通用人工智能(Artficial General Intelligencce,简称AGI)到来了,这是最大的判断。这一波的突破是语言AI,它跟互联网时代、工业文明、文艺复兴是什么关系,我在信中都做了相应判断。以及为什么我要做这事儿(指创立百川智能),就是要繁荣和延续人的文明。
新皮层:你经常提到你对生命科学很感兴趣,为什么会对这样的议题感兴趣?
王小川:我读研究生期间,做的题目就与基因相关,做基因测序的拼接算法。当时科学界发现,从DNA到人的过程是个足够混沌和复杂的事。基因背后的演化也非常复杂,原本会出现混沌或不可预测的结局,但最后它变成了生命,变成了人,有两只手、10个手指头,甚至还跟爸妈长得像。这个事情在数学或物理上讲没有算法可以解释。
我们已经掌握了苹果掉在地上因为有万有引力,天上的星星如何运动我们也能算得很清楚,但是生命背后的数学模型我们还没有建立,这是我从读研究生开始就特别感兴趣的一件事,如何用科学甚至用数学模型去建立对生命的理解。
新皮层:这是个特别学术性的问题?
王小川:有实操性的,比如说2021年,AlphaFold干的就是这件事情,它能够把基因到蛋白质结构的关系用AI模型建立起来。给一个基因,模型就能告诉你它的三维蛋白质结构长啥样。它用数学或者计算机解决了一个生命现象问题。
新皮层:当时你并没有像现在跟进GPT一样跟进AlphaFold?
王小川:因为AlphaFold虽然很性感,但是离解决人的健康问题之间的路还非常远。我当时更愿意走另一条路。2021年搜狗并给腾讯之后,我就说我要做与生命科学相关的事,走的并不是AlphaFold的那条道路。它只是把蛋白质结构变成数学模型了,并没有端到端地把健康变成数学模型。
新皮层:意思是从蛋白质到人还有很远距离?
王小川:没错,距离特别远,就像做自然语言处理的模型只学了分词,距离做出一个GPT还有非常远的路。所以我认为有其他更多实操性的方法,可以用来研究生命健康的数学问题。
新皮层:GPT让你离接近这个问题更近了吗?
王小川:GPT跟我之前的工作经历高度相关。搜狗之前做搜索和输入法,研究的就是语言里的规律。搜索其实是猜你想要什么,输入法是猜你想表达什么,背后都有复杂的语言模型。技术上我们也从原来的符号处理走向了深度学习。当时我们就提出一个观点,语言其实是这个世界上相当难解决的一种问题,我们称为“自然语言处理”,是人工智能皇冠上的明珠。2016年我就已经认识到了,一旦机器掌握了语言,通用人工智能就来了。
甚至当时我们也提到,说搜索的未来是问答,给个问题就回答,而不是输入个关键词后给你10条链接。在那个时代,我们也提到了搜狗未来的方向是让表达和获取知识更简单。以前,搜索是让你获取信息的,但是它不能让你有知识。今天这些全都到来了。因此今年1月份开始使用ChatGPT的时候,我就深刻感受到机器已经掌握语言,而且通用人工智能时代已经到来了。
新皮层:在搜狗出售给腾讯的时候,GPT-3就已经出来了。
王小川:对,那会儿我会看一些论文,但是那个时候我主要在思考怎么把生命变成数学问题、变成数学模型。所以看到GPT这种突破的时候,我印象很深刻的是,在提问题的时候,加上一个prompt咒语“think step by step”,让GPT再仔细想一想,它的回答就变得更好,预示着这个机器开始有一些更智能的模式。
但不管学术界也好,包括我们自己,都没有想到这样一个东西离通用人工智能有多远。因为它是一个To B的系统,不是只看文章就能对它有认知的。直到去年年底,ChatGPT发布,你才能去体验它,看文章和亲自体验它是两个不同的事情。
新皮层:你是技术背景,你会不会偶尔也会想,为什么不是我或者我的团队做出了这样的技术突破,或者说更早看到了GPT的潜力,而不是这么晚进场?
王小川:你的晚是指的从2021年开始做,还是从今年开始做?
新皮层:你不认为你是从今年开始?
王小川:搜狗2021年的时候就在做大模型,在国内的GLUE榜单(Chinese Language Understanding Evaluation,中文语言理解测评)上拿了两次第一。
新皮层:你当时没有今天的这些认知,没有预料到AGI会来?
王小川:对,就是我们知道大模型长啥样,但确实没有预料到这个技术的突破。这不是我一个人没想到,这是除OpenAI以外所有人都没想到的事。GPT-2和3出来的时候,除了OpenAI,我并没有看到任何一个公司或者个人、特别国内的人认为通用人工智能到来了,甚至直到ChatGPT到来之后,我也没看到其他人讲通用人工智能到来了。
新皮层:离开搜狗之后,你还有过一个创业项目,是与大模型有关吗?
王小川:搜狗是做语言AI的,搜狗出售给腾讯后,我切换到了用数学模型解构生命,(做大模型)中间有一个暂停的过程。我今天做的事情和这两件事都可以连接。
因为当你想用机器为生命建数学模型,甚至帮你做健康管理的时候,你可能也需要一个虚拟医生或护士做沟通,不管见面手段还是后期健康管理,都需要有一个伙伴去支撑。所以今天大模型带来的可能是超级助手,能够让健康管理的闭环更容易完成。
新皮层:可不可以理解为你在用新一轮的AI技术重做上一份创业内容?
王小川:新技术能够对之前的工作带来精神上的鼓励,但并不能覆盖对生命的探索和相应的数据处理方法。大模型是以语言为核心的,它并没有对你生命指标各方面的监测,或者从某个生理指标的数据中发现生命规律,所以不是相互取代。就像无人驾驶一样,大模型提供的是同样的基础。
新皮层:你要做的话,会做To B还是To C的产品?
王小川:比较成熟的领域已经有To C产品覆盖的时候,我们就做To B。但是对于增量的、大家没见过的产品,我们会做To C。比如说在教育领域,现在已经有很多教育网站了,他们可能会在中间构造一种虚拟老师,那我会做To B的事情。但是像医疗、法律领域,从来没有存在过这种虚拟的知识供给,那我们就可以做To C的。
终局:GPT不只是语言模型,而是未来所有AI的基础模型
新皮层:你觉得GPT-4在哪方面的能力超出你的预期?让你觉得它非常有商业潜力?
王小川:GPT的核心就是机器掌握了语言,它变成了一个懂表达、善于表达的机器,同时它还拥有世界常识。整个世界上已经发生的事、知识、常识甚至简单的推理,它都掌握了,这是非常了不起的一个突破。
新皮层:机器掌握了语言后,你认为它能够做到的事会是什么?
王小川:有这个能力之后,它能做的第一件事就是把人类已经遗留的以文字承载的知识都学习了。第二,它能跟人做正常的沟通交流,你给它一个命令,它能够理解它、解释它、完成它。
这时我们对它有个重新定义,它不再只是个工具,而是人类开始拥有的一个伙伴、一个助手,这是从来没有的事情。以前人类发明的火、轮子,甚至计算机,都只是工具,它们不具有跟你对话的能力。
新皮层:具体到产品形态上,可能诞生哪些超级应用?
王小川:比如说出现很多虚拟伙伴,它能够在情感上陪伴,或者有足够素质的护士、医生、律师、老师,这样的产品叫助理也好、咨询顾问也好,这是以前没存在过的东西。
新皮层:上一个AI时代已经出现过一些AI产品和商业成功的公司,GPT时代会有什么不同?
王小川:首先上个时代还是信息时代,最多叫数据智能,我认为这次才真正开始进入到了AI时代。通用人工智能来了,机器开始学会学习了,有常识了,能跟人沟通了。以前还是靠人喂很多数据进去,在专项里解决一个垂直问题。ChatGPT的发布代表新时代的开启,两个时代是不一样的。
在上个时代,一个做图像识别的公司需要做大量的定制化服务,很难有通用模型,成本也非常高。所以之前这个时代里的公司虽然已经发展到很大的收入规模,还是很容易亏损,所以我并不认为它是一种成功的AI范式。
新皮层:IBM曾经尝试开发名叫“Watson”的AI医生,没有成功,大语言模型可以把这件事做成吗?
王小川:Watson是要取代医生的,它失败了,因为它并不能通过一些考试,或者比医生干得更好。这次真的有机会了。ChatGPT参加考试的确能够考到专家的水平,甚至它能跟人沟通互动,不管在医院里撰写病例,还是帮医生检索数据,或者居家陪伴给病人提供安慰、做抑郁相关问题的问诊,这些事终于开始能够做到了。
上个时代里的AI产品即使能够看医学影像,也不能取代一个学了8年的医生,它们取代的只是中间看片子的技师角色,并没有丰富的医学知识。
新皮层:未来医院可能雇佣ChatGPT这样的员工?
王小川:对,与其讲医院场景的雇佣,我更看好每个家庭,甚至每个人都开始拥有自己的一个私人的家庭医生。
新皮层:如何解决它一本正经胡说八道的问题,这个问题在医疗领域后果很严重?
王小川:我认为今天的生成式模型只是刚刚开始,这个问题需要生成模型与信息检索的合作,再加上大量的强化学习,是否能够从强化学习里面把这个能力调教好?未来很多工作要去做。
没必要用AGI元年的技术去判断未来发展。我是非常乐观的,再往下机器辅助医生,甚至取代医生是必然会发生的。
新皮层:很多公司已经在竞争办公领域,让办公工具更智能,你认为有前景吗?
王小川:短期里面会有变化,让机器写文案或者辅助写文案会十倍、百倍提高人的效率。但我看重的变化是在终局里面,为什么还要写文案?人并没有写文案的需求,写文案也不是创造力的一个核心。
新皮层:可能是他客户的需求,他老板的需求?
王小川:对,所以往后发展,会有大量的这种写文案的工作岗位会消亡,会出现叫“端到端”的行业结构,写文案这种中间过程的企业会消亡。
新皮层:GPT现在看起来只是一个语言模型,它的能力边界在哪里?比如未来它可以驾驶汽车吗?
王小川:GPT非常大的价值是试图让机器掌握智能、掌握认知。我们找到了一条通往AGI的道路,就是“大语言模型(Large Language Model, LLM)”。在此之前,做无人驾驶或做机器人都只是在做图像处理,机器并没有理解这些物体。
今天的大语言模型已经被学界称为“foundation model”——基础模型。我们开始有种共识,未来不仅是做机器人,还是做无人驾驶,都会基于这个基础大模型往上生长。这是我们第一次通过大模型找到了一条认知世界的通路,这条通路可以成为解决其他更远期AI问题的基石。
新皮层:你看到的终局:AI医生、AI教授、AI律师、甚至AI司机,大概是多久之后会发生的事?
王小川:我觉得这个时间不会很久,大概就3-5年吧。
新皮层:到时,商业模式会发生变化吗?
王小川:我们认为免费、羊毛出在猪身上的模式会慢慢被历史淘汰掉。随着机器越来越强大,它跟用户的关系就变成一种伙伴,你很难说一个伙伴说陪伴你的时候是免费的,我再从其他地方去赚钱。
用户会更希望他的伙伴足够忠诚、足够专业,能提供足够有价值的服务,因此商业模式方面未来很有可能是个人直接向产品付费,而不是原来免费的广告模式。
新皮层:如果大模型未来变成很多公司都能掌握的技术呢?
王小川:比如做搜索,好像这东西谁都会做,但最后有几家公司真的做成了搜索引擎?
新皮层:我们听到两种观点,一种认为未来的产业生态会是小部分公司开发大模型,大部分公司做下游的接口应用;另一种观点认为,大语言模型会逐渐变成每家公司都能掌握的技术,类似上一个时代的推荐算法、图像识别,很快竞争重心就会转到对商业场景、产品形态的把握,而不是模型训练本身。
王小川:我认为开发大模型的公司未来不会特别多,而是掌握在少数几个公司手上。因为大模型是一个技术高度发达的东西,会有一定的技术扩散,做一些更加简易的小模型,在垂直场景里应用,但这种可能性可能只占一半。
更有可能是一个大模型覆盖很多小模型做的事情。所以我更相信未来的生态是由少数几家大模型公司,再加上一些小模型的公司构成的,而不是每家公司都掌握一个这样的技术。这个技术不像图像识别那样简单。
也蛮难有公司能够既掌握大模型又掌握场景。OpenAI做到了,比如它的ChatGPT,就是蛮有想象空间的一个应用。我周边很多人已经开始减少对搜索的使用。
(这是我们与王小川对话的上半部分,想了解他在“大语言模型开发中的实际挑战、AGI的未来技术趋势”方面的观点,请关注明天的发布。)
-END-
责任编辑:周唯
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)