2016年12月01日13:13 新浪财经
广东省游戏产业协会秘书长、广州灵聚信息科技有限公司联合创始人及CEO 张胜 广东省游戏产业协会秘书长、广州灵聚信息科技有限公司联合创始人及CEO 张胜

  新浪财经讯 “2016中国高新技术论坛”于11月16日-18日在深圳会展中心举行。广州灵聚信息科技有限公司联合创始人及CEO张胜出席并演讲。他表示,在现在的这个人工智能时代来临的时候,大分工大协作尤为重要,如果在自己的产品当中需要用到这样的技术,完全不要考虑先自己去开发,因为真的,深钻下去才能够出泉水,如果说又要做产品,又要自己去开发一下这个人工智能技术的交互又是什么的,最后可能什么都做不好,还是要潜心研发才好。

  以下为发言实录:

  那我就简单介绍一下,我们之前也是在这个工信部系统,所以跟刚才咱们高裕跃副秘书长的也是老同事了,那么我是从一二年到了广州来,其实也是因为这个人工智能开始,给了我很大的触动,感觉到应该是有了这样一个时机,那么我们这个通过一个分析,因为作为媒体出身的人就是,其实在当年做这个软件世界杂志的时候,经常会跟国内外的这些大的软件企业,还有一些创业的企业都会接触,那么在这样的过程当中,我们也就是运用这样的分析的方法就觉得,实际上人工智能技术我们走到了一个,应该说一个非常好的一个新起点,那就是互联网移动互联网和大数据的相关的技术,那么在这样的一个基础下我们发现有一个难点,就是在人机交互领域,语音技术已经发展了几十年,但是依然人机交互比较困难,所以我们在考虑到在语音技术发展到一定程度的时候,那么接下来,那么如果要出现了一个机器人,那么这个机器人跟人需要怎么样的交互?

  所以灵聚从,建立以来一直在解决这个问题,而终极目标是要让机器人具备自主思维能力,那么我们现在,所达到的程度就是具备一定的思维能力,通过来自于语音的、来自于其他传感器的,包括机器视觉的这样的信息,进行综合的逻辑分析和处理,运用知识图谱,相关的知识进行综合的计算,得出一个自己的答案,那么简单的概括来讲就是做了一个人工大脑。

  那么我们现在从这个技术的角度来讲?其实现在大家会注意到在过去的两年以来,智能硬件产品几乎全军覆没,那么我们也是非常的关注,为什么会出现这样的情况?实际上是在于一个技术的商用化的问题,我举个简单的例子,现在在机器人人机交互的层面上来讲,比较困难的是情感的问题,那么情感的交互的问题实际上有这么一个数字,人和人之间交流的手段有3种,分别是动作和表情,另外是语气语调,还有一类就是文字本身,那么当我们如果不是面对面交流的时候,那么动作和表情就缺失了,如果我们是靠键盘来交流,那么语气语调也消失了。那么这个时候只剩下文字本身,而文字本身只占大约7%的信息量,那么剩余的93%没有了,这实际上恰恰是现在人机交互通过语音方式交互所缺失的,那为什么不可以通过语气、语调和视觉识别来补充,这个当中有另外一个问题,像现在这个我们灵聚人工大脑的平均响应时间是20毫秒,加上这个网络延迟,平均下来大概是一秒钟以内,可以给用户反馈答案,而如果加上了相关的情感识别,大概响应时间会增加到8秒左右,那么如果每一次的交互都要等8秒,估计东西就没有人用了。

  所以实际上,随着技术的进步,我相信很快这个时间的问题就能解决,而我这里只是举了一个简单的例子就是在过程当中,实际上我们是需要跟很多领域的企业和这个相应的团队做出这样的合作,而我们自己的能力只是专注在解决好我们能解决的这个,知识图谱的构建与一分析和核心的,能够产生机器思维能力的相关算法上面,那么至于其他的方面我们都是通过合作的方式,那么包括传感器等等,其实这个大家也可以去看一看今天展会现场的机器人,大家可能会发现只要稍稍吵闹一点,机器人在现场对话就很困难,网络的条件稍稍拨动一下,交互起来也非常困难,所以实际上现在的技术,真正的商用化受限制的情况非常多,那么我们现在的这个技术既有海尔用我们的技术做了智能家居产品已经上市了,那么IBM也采购了我们的技术,软银的机器人闹现在对外推推荐的唯一的商用化的解决方案,也是我们灵聚提供的,包括国内知名的几个大的机器人公司,还有玩具公司现在也在,那么在这样的情况下我们实际上一直在仔细琢磨着在这个当中所遇到的各种,实际落地的商用化的问题,比如说,前段时间有一个银行采购了我们的东西之后提出了一个要求说,必须跟外网隔离,这问题就大了,不能联网,所以实际上就是在解决实际商用问题的时候,我们会发现有的时候云解决不了所有的问题,所以我们就必须面临现实的问题,包括网络环境的问题,现在人机交互,以现有的基于云的方式实现的话,对网络的带宽要求不高,但是对网络的延迟稳定性要求极高。

  因为刚才我也讲过我们的平均响应时间20毫秒,这个时候如果说网络当中突然出现了一个10%几的丢包率的现象出现,可能基本上和这个用户的交流体验就会很差了,如果说这个时候,这个网络还在防火墙硬件防火墙后面,那么它的延迟很可能上升到1000毫秒以上,那么这个时候的交互体验也会很糟糕,所以就是在现实的当中我们实际上面临很多的问题,那么我刚才提到展会现场的机器人交互不畅,实际上它所涉及到的东西是什么?居然就是麦克的问题,麦克风,现在的声学技术根本解决不了,同时原厂识别又能够解决展会现场这么复杂的降噪问题,我问过很多的这个声学设计专家都要求我告知,现场的实际的使用环境,包括这个麦克隔在什么位置他周围的空间结构是什么?距离它的这个噪声声源在哪?我就是觉得这个东西已经完全不可用了,一个展会现场我完全不知道这些参数,所以根本没有办法预先进行降噪的声学设计。

  因此我们现在推出的展会现场用的解决方案,拿了一个无限大麦克,这个去年在世界机器人大会上,国家领导人李源潮副主席和刘延东副总理到我们的展台上,也都是拿个大麦克跟机器人对话,虽然机器人就在面前,但是因为周围非常吵闹,机器人本身自带的麦克已经不可能正常工作了,所以这都是现实的情况,那么因此我们就觉得到了人工智能时代,可能原来我们互联网思维当中的模块不破,也许不是对的,因为人工智能现在仅仅也是一个起步阶段,是一个需要长期的甚至是长跑的这么一个事情,太快了搞不好根本达不到商用化,变不了现,死的更快,那么另外一个就是,大成功大协作,人工智能的细分领域非常多,每一个领域涉及到的都是高精尖的技术,像刚才商汤科技这边所做的机器视觉,真的技术非常高深,那么在这个方面我们在做人工大脑机器,我们的眼睛就需要类似像商汤科技这样的技术,给我们提供这样的支持。

  实际上我们只做了大脑,那么机器人既有耳朵是这个麦克风,眼睛是来自于机器视觉等等,那么这样在实际上在现在的这个人工智能时代来临的时候,大分工大协作尤为重要,所以我们也很乐于就是继续把我们的技术打造成一个开放的通用的这么一个核心技术,那么包括我们更多的园区里面的创新者、创业者。如果在自己的产品当中需要用到这样的技术,完全不要考虑先自己去开发,因为真的,深钻下去才能够出泉水,如果说又要做产品,又要自己去开发一下这个人工智能技术的交互又是什么的,最后可能什么都做不好,还是要潜心研发才好,我说的比较多,谢谢大家。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

责任编辑:任琳贤

  《财经会议》报道你看不见的会场实况,传播会议精华内容,会议直播提前预告,不定期送出免费超值会议门票。官方微博:财经会议,微信号:caijinghy。扫码更方便。

财经会议

相关阅读

0