王小川:AI还不具备创造和推理能力,无法取代人类

王小川:AI还不具备创造和推理能力,无法取代人类
2019年12月09日 22:05 中国企业家

  王小川:AI还不具备创造和推理能力,无法取代人类

  文|《中国企业家》记者 崔鹏

  12月8日至9日,由《中国企业家》杂志社主办的2019(第十八届)中国企业领袖年会在北京盛大举行。本届年会以“决胜2020”为主题,董明珠、刘永好、陈东升、王石、宋志平、宗庆后等上百位企业领袖齐聚一堂,上千位行业领军者到场。

  9日上午,搜狗公司创始人、CEO王小川在大会现场发表演讲,阐述人工智能(AI)的发展方向,以及搜狗在AI领域的发力方向,尤其是在语言AI方面的尝试与积累。

  王小川认为,目前AI在C端(消费者端)并没有太多商业模式方面的成功案例,更多在做的是to B(产业互联网)相关的事情。

  在他看来,智能音箱并不是AI在硬件领域的未来产品形态。首先,AI硬件正从固定设备走向移动化,智能硬件的走势应该是便捷化和穿戴化;其次,智能硬件应该更加IoT导向,而不是计算力导向。

  在人工智能领域,搜狗目前的探索方向是“语言”,其中包含语音识别、语音合成以及分身技术等。

  “人工智能还没有创造力和推理能力,就是因为它对语言没有充分的理解。”王小川说,这恰恰是搜狗要攻克的问题。

  搜狗从2012年开始提出自己的人工智能理念,在以自然交互和知识计算为核心的语言AI战略下,截至目前,搜狗已经在这条路径上推出了AI录音笔和AI合成主播等不同产品。

  对于人机间交互的未来趋势,王小川认为,未来跟语言相关的应用场景,更多要靠人机耦合互动的方式,向人类提供帮助。

  在现场提问环节,阿里巴巴产业互联网中心主任陈威如向王小川提问,未来是否有可能制造出一个机器人,能理解人类情绪,成为人类心灵的伙伴。

  王小川回答说,以人类目前已知的技术无法做到这一点,机器本身对语言的理解已经非常困难,如果要理解人类的心灵,目前没有任何技术可以做到,但“一旦做到,机器就可能系统性的取代人类”。

  以下为王小川在2019(第十八届)中国企业领袖年会上的演讲内容:

  智能音箱不是未来AI硬件形态

  2016年的时候AlphaGo面市,大家都觉得AI时代来了,结果三年过去,这个概念仿佛又变得模糊了。AI今天主要是做to B的事情,在商业模式里,C端并没有见到多少成功案例。

  今年3月份搜狗录音笔开卖,这是第一款完整继承搜狗AI能力的硬件。用户拿到录音笔之后直接就能转写成文字,能云端存储,能够检索,能够生成文章的摘要,帮助用户做编辑。所以,一切东西都发生了本质的变化,这款硬件不仅是对传统收音功能改进,对声音背后意义的理解和处理也达到一个新高度,它甚至还有同声传译的翻译能力。

  我认为目前的智能音箱不是AI硬件未来的产品形态。这块有两大法则:首先,AI硬件是从固定设备开始走向移动化,从携带开始变成穿戴,越来越轻便,所以智能硬件未来的趋势是便捷化和穿戴化。

  另外就是更加的IoT导向。以前的PC机是计算力导向,内存大、速度快。后来有了声音、麦克风、各种传感器、GPS以及移动传感器,再到后面加入磁力计和心率监控,硬件能从环境中捕获更多数据,这些数据来自身体感官,智能硬件逐步从人适应机器走向机器适应人。

  所以基于这两个趋势我对音箱有保留意见,它既不够移动,也不够IO,它不是未来的主线。

  搜狗的竞争力在哪?

  搜狗的竞争力在什么地方呢?我们使用了一个技术方面很性感的词,叫做“语言”。现在做图像的很多,做语音的也有很多。语言在领域内是最有挑战性,也最诱惑的事情。

  当外界谈到人工智能的时候,如果用户看到一个机器,谈论它是否智能,可能第一反应就是跟它聊两句,如果它能跟你对话,能回答你的问题,用户就觉得它很智能,这是我们本性中对智能的理解。在图灵测试中也提到,能跟你对话的机器就是具有了人工智能。

  今天大家认为人工智能可以解决重复性的劳动,就是因为人工智能还没有创造力和推理能力,就是因为它对语言没有充分的理解,这就是搜狗要攻克的问题。

  搜狗之前做过输入法,也做过搜索,前一个是用语言帮助用户表达信息,后一个是用语言帮助用户获取信息。因此搜狗拥有很好的场景,在语言里面帮助用户做输入和输出。

  当下人工智能领域有两个核心概念,一个是感知问题,就是模仿人的大脑连接,深度学习获得语音图像的能力,这类产品形态我们称之为“自然交互”,机器能够产生理解人行为的能力,能够表达人类的声音和图像。

  比如以前的输入法用五笔,后来是拼音输入,现在用户能使用表情、手势来驱动,让机器以人的方式来进行沟通,这是一个非常重要的事,是以语言为核心的自然交互,是跟我们的感知系统特别的相关。

  另外一件事情称为“知识计算”,就是在语言之上提取出跟语言的关联关系,在里面产生推理能力和知识的观念能力,这叫计算能力。

  前面讲的是感知,后面讲的是认知。

  因此搜狗从2012年开始提出自己核心理念,就是围绕着自然交互和知识计算去发展属于自己的核心语言AI能力。

  在自然交互领域内,搜狗目前更关注OCR,做文字的理解,以及语音、唇语的识别等跟语言密切相关的部分。

  在知识计算领域内,对话、问答和翻译更为搜狗所重视。翻译是知识计算里面比较简单的事情,在对知识的理解程度上,相较于对话和问答更浅显。搜狗已经进行的尝试有翻译中的同传,视觉翻译,实时的同传翻译,用中文搜索全球信息的翻译等。

  搜狗因为有输入法,所以今年的语音识别请求已经超过8亿次,在峰值的时候,搜狗是最大的语音识别应用,它是包含在输入法里面的。

  对于现在的语音识别引擎来说,最新的要求是提取出更多人和语义:

  首先,要做人物的分割,不同的人说话的时候,AI能通过声纹做切割,分清楚每个人分别是谁。

  其次,AI要能把声音中的笑声、掌声和音乐声识别出来,因此它不仅要识别语音文字,还要识别其他结构化的信息,甚至一声狗叫也能识别并告诉用户。

  第三,中英文混合识别是行业前沿的难点。这类识别,调动的不仅是语音识别感知的系统,还牵扯到人类的认知结构。因为两种语言嵌套在一起,所以AI听的时候会突然发现语义不对,这个技术已经超越了目前深度学习的能力。

  除了语音识别之外,语音合成是搜狗在做的另一项前沿工作。

  目前已经有技术能做到合成各种在线、离线的男女声音,甚至多种语言的合成。这里的难点在于,如何把情感带入进一种声音,合成另外一个人的声音。

  怎么理解呢?就是人类讲话是带有情感的,但机器没有情感表达的能力,如果用“声音皮肤”贴上去,就可以合成出带着情感的“人声”,这是行业中最核心的能力。

  今天的语音技术、人工智能技术,还不能承担表演的职能,它只能做一些简单的合成,表演需要AI在语义背后做深刻的理解。

  现在虽然做不到让AI去表演,但搜狗会用其他方法,采集一个人的声音,让机器分析,进而能合成、模拟出这个人的声音,目前已经可以标准化输出,这项技术有机会改变整个行业的音频生产模式。

  搜狗已经在和一些内容工作者进行相关的音频输出尝试,但随之而来的一个问题就是,如何分辨人类的劳动成果,到底是对外输出的知识本身,还是人类的表演本身,机器在其中扮演什么样的角色?除了产权和法律问题以外,还有更多伦理和价值的梳理工作。

  搜狗在研究的另一个重要方向,是分身技术。它不是单纯的语音合成,而是真人的视觉合成。

  此前,搜狗已经与新华社的一位主持人合作,利用她的视觉和声音,经过建模后获得主持人的视觉合成能力。只要输入一段文字就能合成这位主持人的视频播报,它目前已经取代了这位主持人的部分工作,播报过3000多条内容,也是全球首个取代人的“AI主播”。

  让机器更好地辅助人

  中国目前是世界人口第一大国,大概有15亿人讲中文。第二大语言是西班牙语,第三是印度语,第四大才是英文,只占全球4%。但是今天95%的网上信息表达是英文,近100%的商贸活动是用英文写的。因此中国人要学很多年英文去跟世界进行交流。

  搜狗觉得有责任让中国人不需要深入当地生活,研究当地语言,也可以用机器辅助人交流。

  2016年搜狗全球首个发布从中文到英文的同传系统,2017年做了跨语言的搜索引擎,你可以用中文搜索全球信息,英文或者日韩信息都可以,然后翻译成中文信息。去年三季度发布全球首个英文到中文的同传系统,并且已经在一些不严肃的场合投入使用。

  今天AI做的还是重复性较高、没有创造性的劳动,那些有创造力或者需要有表演才能的工作,今天机器还没法取代。

  人类的文化越长,对AI的各项能力要求越高。随着深度学习的发展,对语言的初步处理已经可以产生简单的对话和问答能力,这就有机会在搜索行业中做一些改变。以后问题和答案会变成常见的与机器沟通的方式,这也是自然交互的升级,充分利用了知识计算的能力。

  现在有很多的公司在干类似的事,比如说国内的音箱产品,或者国外的Amazon的Echo,还有Google Assistant,都在尝试在对话问答中做一些工作,搜狗也在做类似的产品。

  不同的是,搜狗的问答技术不是在数据库检索,而是能同时对网上百亿的网页中间寻找答案,不过机器并不擅长推理,它有超越人的地方,但跟人类相比,还有很多不足的地方。

  所以未来在语言相关的地方,更多是靠人机耦合互动的方式,才能为人类提供相关帮助。

责任编辑:刘万里 SF014

王小川 搜狗

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 12-12 聚辰股份 688123 --
  • 12-11 和远气体 002971 --
  • 12-11 甬金股份 603995 22.52
  • 12-11 中新集团 601512 --
  • 12-10 嘉必优 688089 23.9
  • 股市直播

    • 图文直播间
    • 视频直播间