2016年07月16日13:45 新浪财经
搜狗CEO王小川 搜狗CEO王小川

  新浪财经讯 “奇点·创新者峰会2016”于7月15日-16日在上海举行。搜狗CEO王小川出席并演讲。

  王小川在谈到人工智能时表示,对于搜索公司而言,人工智能技术的引入没有颠覆市场,而是使用户需求得到渐进性的提升。“搜索公司本身就在做人工智能”,其称。对于搜索引擎的下一步发展,王小川认为,语音搜索会是一大亮点,在现场,王小川还展示的搜狗的语音识别搜索技术。

  以下为演讲摘编:

  王小川:谈到人工智能,我会有一些反思,大家可能过多的高估了人工智能的未来。上半年,我还是鼓吹AlphaGoo这样一场跨世纪比赛的人。当下,全球范围内的投资异常活跃,中国也一样。在这个时候,我想谈到“我们得小心,什么地方是陷阱,什么地方是真的人工智能的未来”。

  一个月前,我去谷歌跟AlphaGoo的工程师做了深度沟通。有什么样的算法能够改进赢得第四局的比赛?谷歌的工程师跟我苦笑说:你讲的方法我们都试过了。回到我们对于深度学习的讨论,今天大家知道它有巨大的危险。因为传统做人工智能的一些专家就在语言深度学习本身有它的缺点,稳定性不够。在一些需要完全可靠的场景里面,它没有完整的数学计算和证明。所以这种情况里面,即便它是99%的正确性,也可能会带来不确定。比如:在无人驾驶领域,这1%都不确定性,就可能带来汽车的失速,而且我们还不知道怎么修改。深度学习能够做很多事情,但是到现在我们人类的技术掌握还是太浅的。

  今天语音识别已经到了比较高的准确度,已经接近实用了。但是还有很多的限制。比如我们需要安静的环境。当有噪音的时候,如果同时有两个人在说话,机器就搞不定了。我没有办法去去除噪音,比如在汽车里。我们会预先录制有发动机引擎的声音,或者是车窗玻璃的噪音把它加到我们的识别系统里去。就把机器没见过的环境,变成机器见过的环境就能够做识别了。但我跟工程师聊,如果有两个人说话怎么办呢?总有一个人的声音是听不见的。我们的解决方案是用麦克风矩阵,当有一种麦克风的时候能够定向的做识别,如果两个人不同的位置不同的声音音源,就可以分离开。

  人是靠两只耳朵定声音吗?如果只有一只耳朵,或者两个人在同一个方向说话,会怎么样?人是能识别的。对吧?机器就做不到了。我也问了搞神经科学的人。他们会说,如果当有两个人说话的时候,位置不一样,人就能分离开。如果位置一样,一个人声音大,一个人声音小,也能分开,如果两个人声音一样大,一个是男声、一个是女声,也能分开。如果都是男声,但一个人说中文,一个人说英文,也能分开。所以人是在一个环境当中,只要能够找到一线机会去把两个声音的不同能够找到这样一个特征,就能动态的去分离。

  但是对不起,今天在全球范围内,我们号称在语音识别有各种各样的重大突破,还是解决不了这样的问题。所以我们知道,今天的计算机离人还有巨大的距离。除了这样的一个技术本身的瓶颈以外,我们在创业当中,有很多领先的技术公司还会面临什么样的瓶颈?很危险的,一种可能性就是有技术。带着这种技术去找市场,比如:我们做了人脸识别,就开始想像人脸识别怎么去使用,就去找市场的方向。但是很有可能在这个过程当中没有找到,我们公司就死掉了。也有一种可能性是在找市场的过程当中,我们花了很多力气去组建销售团队。我们去尝试跟各个领域去结合,但是这个时候,忘了技术的源头。因为技术是不断在迭代更新的,如果我们不能够跟高效、跟前沿的技术保持同步,可能我们偶尔找到了一点市场,但是我们的技术一定变落后。

  今天在中国的人工智能领域里面,做语音识别、图象处理的公司有很多已经掉到了这个陷井里。所以我跟投资人也在讲,非常不容易,技术本身就没有这么靠谱。即便技术靠谱,可能没有市场,即便有了市场,可能我的技术已经丢掉。像我们的做法,就是已经有广大的市场,搜狗的输入法、搜狗的搜索已经有千万的用户在使用。这种情况我们去找技术的时候,就会心里更加的踏实。

  我在这里画了一个简单的树,树根就是技术、树干是我们的产品。大家真正开花结果是最后的市场。所以有些情况,当我们有根的时候要努力的发芽、长树干,要等它们开花结果,中间的困难是非常多的。而还有很大的困难,如果有了这样一些果实,我们有了市场的时候,或者我们认为我们有市场的时候把根基给丢了。人工智能跟高校、学术界的联动是比较多的,要不断的跟技术的前沿保持同步。比如李志飞一定会要求他的工程师团队读论文甚至写自己的论文,把这个前沿给跟上。人工智能创业不像以前的互联网创业一样有一个模式就够了,而是要不断的把技术积攒起来。

  在这里面也提到一个命题作文:我们怎么讨论“技术”跟“幸福”之间的关系?在座大多数的人本身不是搞技术的,因为大家敬仰技术、崇拜技术,所以我们会过度的沉寂在技术里,自己想像出它无限的光环。其实跟幸福没关系,是因为我们的不理解、恐惧和向往带来了一种误解。

  现在有一些比较酷的场景实现了,比如自动驾驶、能听懂我说话、诊断疾病、一键送咖啡。这些听了是不是有一些幸福感?不再是“虚拟现实”这样冷冰冰的术语,这是我们看到的幸福。

  搜狗对于技术和幸福之间的联系和理解是什么样的呢?其实有朋友跟我谈搜索的时候说,王小川,你们要转型做人工智能了吗?我说:不是,搜索本身就是一种人工智能,而且是有幸福感的人工智能。因为它能让每个人变的更加强大,有时候我跟一个90后走在一块。我发现他很厉害,他无所畏惧。因为他知道拥有了搜索之后,能够解决所有的问题。只要一搜索就有答案。所以今天的这些年轻人,利用技术、利用搜索,变得更加的强大,拥有了更大的幸福感。为什么说搜索就是一种AI呢?

  搜索的第一步是让用户去做关键词的搜索,然后给它提供10条链接。这是搜索今天产品运行的基本方式,但是关键词是最好的输入模式吗?乔布斯告诉我们,更好的方式是用手指直接在屏幕上戳。所以关键词的输入,相对于人的自然输入,就像用鼠标和用手指自然表达一样,是需要继续去提升的。因此搜索引擎往下的进展方向,就是从关键词搜索转变成让人去表达一个完整的句子,机器找出中间的含义。

  同样的,10条链接,也不是我们最想用的方式,而是应该通过用户的问句直接给出答案或者给出你的一个命令,机器去做执行。因此今天搜索继续往下进化,对搜索引擎的公司是一个渐进的过程,就像谷歌已经提到:“自己从一个移动互联网公司变成一个人工智能公司”。

  对于搜索公司而言,人工智能技术的引入不是颠覆新的市场,而是在原有的用户需求里面进行一个渐进性的改进。所以我们提到,搜索公司本身就在做人工智能。如果大家看搜狗觉得不过瘾,可以谷歌。它已经代表了人工智能在今天应用的最高峰。因此在未来的方式里面,类似于像Siri或者其它的人工智能的交互引擎是我们共同的梦想。我个人的判断,这样的一个未来更多是属于搜索公司的。

  谈到“语音输入”,今天成了一个被大家吐槽特别严重的领域,也是我们发展的一个重要环节。大家知道讯飞但是可能不知道搜狗其实是中文语音识别用户量最大的应用,我们一天有1.4亿次的语音识别量,准确度也超过97%。搜狗输入法的用户有7%会使用语音识别,也会让我们不断的去迭代数据,让语音识别做的更好。但是刚才提到了,做语音识别是不够的,我们怎么能够把97%能够继续去提升,还要可以进行语音修改,这就是语音识别搜索的下一步。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

责任编辑:梁斌 SF055

  《财经会议》报道你看不见的会场实况,传播会议精华内容,会议直播提前预告,不定期送出免费超值会议门票。官方微博:财经会议,微信号:caijinghy。扫码更方便。

财经会议

相关阅读

中国应该走怎样的创新之路

中国足够大,中国人的心胸足够宽广,我们的地域差距又很大,我们应该既学德国又学美国。我们可以做像BAT一样具有颠覆性的创新。对于我们绝大多数企业来说,恐怕我们还要向德国学习,做一些连续性的东西,就是“从1到N”的改进,牢牢地占领中间技术。

贸易保护主义是经济复苏大敌

中国是全球贸易保护主义的受害者,也是欧美乃至新兴市场实施贸易战的主要目标。尤其是美欧市场,以滥用和消费WTO的方式,几乎是对中国所有出口商品都启动“双反”调查。更糟糕的是,美欧正在协同立场,将贸易保护主义和中国市场经济地位挂钩。

供给侧改革考验地方政府责任心

在供给侧调结构过程中,改善这个地方的教育结构,改善这个地方的资本投入结构等都属于供给侧,所以地方政府可以发挥作用的空间非常大。但是地方政府官员需要有长远的观念,不考虑长远就是不作为,这对他们的责任心提出了更高要求。

80%利润流向金融业是种经济病态

目前金融业占据绝大部分利润的现状若得不到有效改观,中央政府出台再多的财税优惠政策都只能无济于事,这些优惠政策的果实最终都会沦落为金融业的“下饭菜”。同理,受利润低微瓶颈制约,非金融企业尤其制造业的未来经营前景将是暗淡的,甚至是死路一条。

0