北大吴思:人工智能与人生的“神经网络训练”

北大吴思:人工智能与人生的“神经网络训练”
2023年02月28日 17:38 市场资讯

股市瞬息万变,投资难以决策?来#A股参谋部#超话聊一聊,[点击进入]

  主题为“和而不同,思想无界”的CC讲坛第52期演讲2023年2月24日在北京举行。来自北京大学心理与认知科学学院北京大学麦戈文脑科学所研究员吴思出席,并以《人工智能与人生的“神经网络训练”》为题发表演讲。

  以下为演讲全文:

  大家好,我叫吴思,来自北京大学心理与认知科学学院。我想这段时间引起社会最大震动的一件事情,就是 ChatGPT的横空出世。ChatGPT是一种语言加工和对话的人工智能系统,它目前表现出来的智能水平可以说超出所有人的预期。

  比尔•盖茨甚至说ChatGPT带来的革命,可以类比于个人电脑、智能手机、互联网对社会引起的变革。其实在此之前大家也知道,人工智能已经对整个社会带来很大的震动。

  比如说在图像识别方面,它的水平已经超过了我们人类,人脸识别已经在社会各个方面得到了应用,阿尔法狗已经击败了我们人类的世界冠军,这些所有的技术革命正在不断的改变着我们的生活,所以,这也给我们整个社会带来了一种恐慌。

  那么,今天我并不是要谈人工智能如何强大,以及人工智能的一些技术细节,我是从我自己的科研的角度,来谈一谈人工智能技术的底层逻辑,以及这些逻辑能给我们人生发展带来哪些启示。

  其实大家都感觉到人工智能的强大,其实从某种意义上说,在很多技能上人工智能也是有很多不足的地方。

  这里我演示一个图片,是在学术界经常用的一个例子,表现了人工智能对噪音识别的缺乏,这是一个熊猫,我加一点点噪音,人类没有任何问题能够识别出来它是个熊猫,但是机器却认为它是一个长臂猿,所以说在图像识别上,如果有特殊处理过的噪音加入,它是根本无法识别的,这个和我们人类相比还差得很远。

  左下角是13个点,各位都能很清楚的看见这是一个人在走动。我们人识别这13个点代表人在走动,这个任务对我们来说很轻松,但是对于目前的人工智能来说是一个很大的挑战。

  右下角是一个熊的图像,我们都能识别出来,这个熊的图像就是抓住了熊的一个整体的轮廓,但是丢掉了细节,我们人也是没有问题能识别出来这是个熊,但是对目前的人工智能就很困难。

  再比如说,我们人具有小样本学习的能力,一个小朋友也许就看了几张兔子的照片,在生活中所有的兔子他都能识别了,这就是举一反三的小样本学习能力,但目前的人工智能就需要大量的数据训练才能够实现。

  我们在读书的时候,是拿着书本来学习知识,这些知识都是一种抽象的概念,我们人都没有问题,我们都在读书中认识这个世界,但是目前的人工智能还依托于大数据,需要具体的例子才能干好这样的事情。

  所以说,虽然目前人工智能在其专项技能上已经取得了长足进步,但是它对比我们人脑实际上还有很多的不足。我们依然可以说到目前为止,人脑仍然是宇宙中最智能的信息加工机器,这个机器让我们能感知这个世界,能让我们学习、能让我们产生记忆,能进行推理、进行抉择,能产生情绪、喜好、思想等等,这都是我们大脑的优势。

  那么大脑要实现这些复杂的认知功能,它最核心的计算特点就是网络计算,在我们的大脑中,神经元的数目有上千亿,每个神经元平均连接数有上万个,这些的网络构造特别复杂,可能是宇宙中最复杂的信息加工网络,我们大脑能够实现各种智能的任务,都是靠这些网络进行的信息加工。

  我的研究领域叫计算神经科学,它的目标就是用数学建模和计算机仿真的方法来分析大脑网络工作的基本原理,从而能发展更好的人工智能。

  那么既然大脑是用这种复杂的神经网络进行信息加工,所以很自然的一个想法是我们为什么不模仿我们大脑网络的特点来构造一个人工的计算系统来处理信息呢,其实这就是当前人工智能的最核心技术,人工神经网络的思想诞生的源泉,就是要模仿大脑的网络怎么做计算。

  当前最流行的深度学习网络就是模仿了我们视觉系统的结构特点,而且只是模仿我们视觉加工的一些比较简单的特点,我们深度的视觉系统比这个复杂的多,目前在人工智能中还没得到体现。

  那么我们模仿这样一个网络,我们就需要构造一个计算的框架,但是当我们在做具体任务的时候,我们需要训练网络,所谓训练,就是我要给它学习的样本,我有一些输入和输出的已知,就是已知答案的学习的样本,然后我把这个样本喂给网络,然后我调节网络神经元之间连接的权重和结构,使得网络的输出如我所愿,这就是所谓训练的过程,所以说人工智能背后的大数据训练,其实都隐含了这样一个给大的数据作为学习的样本的经历,然后来调节网络结构和参数,使得人类能实现想要完成的任务。

  人工神经网络有这样一个行动过程,其实我们想一想我们人的一生其实也是一个训练脑网络的过程,我们大脑是个网络,我们在婴幼儿时期,我们就通过各种玩耍,去感知外面世界。

  比如说在运动时我们就学会了手眼的协调,到了我们读书期间,我们就读书本上的知识,要知道在每一个学习的过程中,我们大脑的神经网络的连接都在发生着变化,实际上我们的网络也像人工神经网络是在被训练的过程,到了工作中,我们工作的经验会让我们更好认识这个世界,这也是我们大脑在不断学习的过程。

  我们终其一生的生活、学习和工作,实际上是在不断地让我们大脑内部发生着变化,我们实际上正是在训练我们的脑网络,最后我们形成了世界观和人生观,所以说孔子说得很好,就是二十弱冠,三十而立,四十不惑,五十而知天命,但后面还有,因为我现在就是50岁,我就在这stop了。

  我们人的一生,其实我们的脑网络都是随着我们生活和学习或工作在不断的发生变化,我们每天的生活其实就是在改变和训练我们的脑网络。

  人工网络想模拟我们的脑网络,其实和我们人生的发展是紧密相关的。我们觉得我们的人生特别的复杂,我们有总结各种各样的成功的经验,但是我们有时候依然想不清楚我们人生怎么应该过得更好。

  那么既然人工智能是模仿我们人的脑网络,虽然结构很简单,同时现在人工智能已经发展了很多的算法和技巧来优化人工神经网络,所以说我们也许可以从人工神经网络的发展中反过来去看我们脑网络怎么才能训练的更好,或许会给我们人生的发展提供一些启示。

  这就是我今天想要谈到的给大家分享的要点。那么在人工神经网络的训练过程中,就有很多的要素。大家会发现这些人工神经网络训练的要素也是我们人生发展的要素,那么你要训练好一个人工神经网络,我们第一步就要选择一个目标函数,所谓目标函数就是我们要定量化。

  在数学上就叫目标函数,这个目标函数选择好与坏就直接决定了你最终的网络上限能学成什么样子,那么对应着就是我们人生,我们要选择人生的目标,这个目标既要实现人生的个人价值,同时也要服务好这个社会。

  有了好的目标,我们的人生才有一个好的发展是吧?可以说我们的人生的目标实际上决定了我们脑网络训练的上限,我们一定要定好我们人生的目标,我们人生的路才能走得好。那么有了目标函数,那我们就要开始训练网络,刚才我说了所谓训练就是你给网络提供样本,然后你要调节网络的参数,使得网络的输出如你所愿。在AI中,就是要讲究用海量的数据,用所谓大数据海量的样本训练网络。

  然后比如说现在火的ChatGPT,它能成功的一个很大原因是它用了互联网的海量的数据,比如说它用了网上的大量图书馆的书,书本上的知识,还有互联网上大量的文本知识,然后训练了上千亿的参数,然后今天训练完了以后就出现了一些智能的行为,想着超出我们预期了是吧?

  那么训练人工神经网络这个数据特别关键,所以叫数据为王,那么对应着我们人生,我们要训练好我们的网络意味着什么?我们需要丰富多彩的人生给我们的脑网的训练提供素材,就是所谓的读万卷书,行万里路,那么丰富多彩的人生经历,实际上为我们训练好脑网络提供了样本,如果我们没有样本,我们怎么去训练我们的脑网络?

  尼采有句话是我自己特别喜欢的,所以分享给大家,“每一个不曾起舞的日子都是对生命的荒废”,那么用人工智能的术语就是,你又浪费了一天,你没有收集训练你脑网络的素材。

  有了大样本,在训练的时候你还有很多训练的技巧,在人工神经网络训练中,大家就发展了一些数学上的技巧,我现在简单介绍几个,大家会发现很自然地就和我们生活成长对应在了一起。

  比如人工神经网络训练的一个最基本的算法叫误差反传算法,它的本质思想是,我给一个样本,我就做个输出,我发现这个网络输出和我想要的结果之间的误差,把误差反传来,调整我的网络。那么这就相当于我们在学习中,需要从试错中去学习。

  更先进一点的算法叫动量加速算法,这个算法说的意思就是我在调节网络参数的时候,我不仅依赖于当前的样本,我还依赖着过去的历史。那么对于我们人生的学习就是我们要不断反省,我们要总结经验来提高我们脑网络的训练。

  此外在人工神经网络还有模仿学习,就是说你在训练一个网络的时候,你可以模仿一个已经训练好的网络,然后你通过学习来更好的提高你的一个新网络的训练,这对于我们人生就是,三人行必有我师,我们要从他人的优点中学习,总结起来就是人工神经网络都是一些数学上的训练技巧,实际上它和我们人生的发展也是相关的。

  我们人生总结起来就是说,人生要敢于试错,要不思反省,要学习他人的优点。其实我们人生的发展一样,我们在人工神经网络训练中也不是一帆风顺的,你会碰见各种各样的难题,人工神经网络这个领域也是通过一些数学技巧来解决这个难题。

  我这就举两个例子,一个就是你在训练人工神经网络的时候,你训练的所谓的能量函数会录入的局部极小,简单说就是你这个时候,你网络的表现就很难再提高了,我们人工智能的专家怎么做,这个时候我们就会重置网络探索,从头再训练。

  对应我们人生就来说,我们人生可能在某个时候面临一个困境,这个时候我们要勇于求变,重新开始。

  那么在人工神经网络中,我们会有一种所谓的瓶颈期,那么你进入那个瓶颈期,你会发现你训练很长时间,你网络的表现都提高不了,然后你锲而不舍坚持训练的话,在某一时刻我们的表现就突然有个大的提高,这对应我们的人生就是,你碰见了一个低谷,你不要轻言放弃,你要锲而不舍,最终能从低谷中脱离出来的。

  那么最后一个类比我是想讲了一个人工智能中现在面临挑战,同时对我们人的学习和教育,也是一个非常大的难题。在人工神经网络中,我们是用数据去训练它。我们的目标不是说你给定了输出,就给定了输入,我把这两个拟合好就可以了,这不是我们的目的。

  我们真正的目的是,当我训练好的时候,来了个新的我从来没见过的样本,我这个网络依然表现很好,在人工神经网络中叫泛化能力,这才是我们真正关心的问题。因为我们训练样本是已知答案的,我们在网上都能找到的,大家都知道的,我们真正的关心的是网络对新的样本,它依然表现好,这就是泛化能力。那么在人工神经网络领域,实际上这是个很难实现的问题,还没有解决的问题。

  如果一个神经网络你用样本去训练它的时候,你训练的越久,你可能反而泛化能力越差,就是说你的网络的参数过度的拟合了你学习的样本,最后你对新样本的表现就会很差,叫过拟合现象。

  这个就对应着我们学习教育的目的了,我们学习的目的不是我们做很多的题,我们做题的目的不是为了记住这个死的知识,我们是希望具备一种能力,一种创造性的能力,当一个新的没见过的问题出现的时候,我们能够解决它。

  在训练中就面临着一个很大的挑战,如果我们过度训练所谓的题海战术,我们实际上是只记住了死的知识,反而导致过度的训练,我们反而会失去了创造性,造成了思维的定式。所以说这是人工智能领域目前还没解决的问题,怎么有针对性的提高训练的泛化性,只能用有些数学技巧来避免实现过拟合。

  反观我们的教育,都在说我们要培养学生的创造性,但怎么培养也没有给出一个明确的答案,关于教育的本质,爱因斯坦说了一个特别有哲理的话,他说,教育是一个人忘记了他在学校里学到的一切知识之后,剩下的东西就是得到的知识,你要忘掉它,你真正需要掌握的是泛化的能力,对新知识的解决的能力。

  在我们中国的哲学里面也有类似的这种思想,我这里把金庸的《倚天屠龙记》里面有一段特别精彩的对话,分享给大家,当魔教攻上了武当山,张三丰由于受伤没法应战,他需要在非常短的时间内让张无忌学会太极拳。

  徒孙两个有一个精彩的对话,张三丰做了个演示,张无忌就快速的学习,张无忌是个天才,他很会模仿学习,这个时候张三丰就问,“无忌,我教你的东西还记得多少?”,张无忌回答说,“我只记得一大半”,那么张三丰说你继续练过,一会而张三丰又问,“现在你记住了多少”,张无忌说“已经剩下一小半了”,又过了一会儿,张无忌说,“我现在已经把所有学的全忘掉了”,张三丰这个时候说,“好,你可以上了”。最后他把魔教的玄冥二老给击败了。

  这里面暗含了一个思想,实际上是张无忌最终学会了一种人工神经网络的泛化能力,或者说太极拳的精髓,他掌握了一种泛化能力,这里面实际上和爱因斯坦的理念是一样的。我们要学习需要的样本,但是我们不希望样本破坏我们的创造性,所以说这是我们教育面临的难题或者说是我们学习的难题,在人工智能这个领域里,大家都在关心我怎么提高神经网络的泛化能力。也许有一天人工神经网络把泛化能力的问题解决了,这个时候我们就可以让它反过来反馈我们,怎么样才能让我们在学习中不会丧失我们的创造性。

  最后我想总结一下,人工智能它是模拟我们大脑的网络,通过大数据的训练优化我们的人工神经网络。 我们人的一生是在生活学习和工作中来训练我们的大脑的网络,最后实现自我的价值,说两者是相通的,都是在训练网络,都是在实现一种智能,只不过一个是人工智能,一个是我们生物的智能。

  我们每个人其实都是我们自身网络的训练者,当我们今天在惊叹于人工智能高速发展的同时,请不要忘了我们自己大脑是一个更有潜力的网络,它需要也更值得我们去训练好它,因为训练好大脑的网络,就意味着我们度过了一个美满幸福的人生。

  好,谢谢大家。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:梁斌 SF055

相关专题: 2023年CC讲坛专题

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 04-27 曼恩斯特 301325 --
  • 04-27 友车科技 688479 --
  • 04-26 万丰股份 603172 --
  • 04-26 中芯集成 688469 --
  • 04-25 巨能股份 871478 5.5
  • 产品入口: 新浪财经APP-股票-免费问股
    新浪首页 语音播报 相关新闻 返回顶部