科大讯飞:产品矩阵式落地 AI应用价值兑现年到来

科大讯飞:产品矩阵式落地 AI应用价值兑现年到来
2019年05月25日 03:56 经济观察网

  在人工智能几十年的发展历史进程中,有着20年技术经验积累和研发突破成果的科大讯飞,可以算得上是历经了行业大浪淘沙,而今正进入细分领域展望其商业化效果的阶段。“有人说2019年开始大量人工智能创业企业将倒闭,大潮退去,泡沫破灭。”科大讯飞董事长刘庆峰认为,这是因为很多人工智能企业并没有掌握很强的核心技术,而作为中国最早进军智能语音技术的上市公司,科大讯飞不仅在源头技术创新上持续突破,更将语音智能化从B端行业到C端消费领域都进行落地应用。

  在刘庆峰看来,“2019年是人工智能的应用价值兑现年”。不过他也指出,要真正兑现红利,人工智能应用的落地也要符合以下标准。“不能是光讲故事。”他直截了当地说到,必须要有看得见摸得着的真实应用案例,要有能够规模化和可推广的对应产品,同时要通过统计数据去说明在效率提升、成本降低等方面的应用成效。

  对于科大讯飞而言,就在5月21日这天全方位地展现了其技术应用落地的“5+1”矩阵式产品,凸显着科大讯飞用AI提升教育、医疗、司法等各行业的社会服务能力的同时,也在赋能研发人员并帮助消费个体,智能化地与世界获得更深的联结与沟通对话。

  产品矩阵化落地

  在AI虚拟主播“小晴”开场后,刘庆峰走上台,与台下的数千名观众招手致意。“亲爱的小伙伴们,你相信自己的眼睛和耳朵吗?”在刘庆峰道出开场白后,音响中传出的却是疑似罗永浩的声音,不仅如此,现场的观众也在刘庆峰的沙哑嗓音及知名女星的“娃娃音”中“穿梭”了一回。

  这一展示背后是运用科大讯飞开发的实时变声技术,让刘庆峰高兴的是,这一技术在去年的国际实时变声大赛中获得全部指标第一名,成为目前全球最顶尖的变声技术。

  时间回溯至2015年末,当刘庆峰的语音可以实时转录为文本投放在大屏幕上时,科大讯飞率先用技术实现了文本转写,后经过近几年的技术迭代和语音识别的进化,当刘庆峰在现场说出,“Ohmygod,这是谁给你的idea?竟然最后还有一个onemorething”时,屏幕上精准显示出了这段中英文交织的转写文字,而这便是累计用户量达7亿的讯飞输入法进化至9.0版本的成果之一——中英文间、粤语和普通话间,甚至是离线与在线之间,不需要任何切换操作就可以直接”鸡同鸭讲”。

  此外,在科大讯飞执行总裁胡郁的带领下,讯飞翻译机、讯飞转写机、讯飞智能录音笔、讯飞智能办公本、讯飞学习机5个智能硬件新品,分别展示了各自在沟通、学习、工作等多个场景上给人类生活带来的改变。“讯飞翻译机3.0版,中英文识别率已经超过95%,0.5秒以内就能完成一次翻译任务,全年提供翻译服务5亿+次,已在全球197+个国家和地区为用户提供服务。”科大讯飞智能翻译业务部总经理翟吉博在公布“好成绩”及各类演示后,还给出了一个惊艳的功能——“成为AI行业翻译官”,换句话说,讯飞翻译机3.0版可以和7个领域的专业人士对话,涵盖了医疗、金融、计算机、外贸、体育、能源、法律的行业英语。

  科大讯飞消费者BG副总裁葛勇带来了可以就会议内容秒扫即得的转写机。特别的一点是,它因具有角色分离技术,可以应用在多人会议场景中,根据不同的声音区分角色并进行实时转写、内容识别或翻译等。“可以想象一个场景,一个6人的小组会议开2小时,结束后记录马上按照6人角色分出文档,如此可以大幅缩减会议纪要转写的时间。”

  在科大讯飞推出的多款硬件产品中,智能录音笔的受欢迎程度较高,科大讯飞副总裁兼消费者BG副总裁李传刚给出了一个数据,发布前夕在京东平台的预定量已达61961台。对于这款可以应用在会议、访谈、培训记录等场景中的硬件产品,李传刚认为讯飞录音笔代表了科大讯飞翻译转写技术落地的典型,他透露,为进一步增加产品体验,今年还会让其进入线下2500家店。

  为了更全面地覆盖移动办公场景,讯飞读写科技有限公司总经理钟锟带来了“张口就搜”的智能办公本,无纸化记录之下,这个本子可存储近2000本笔记内容,“一句话”语音命令下就可以将过往的文字记录、录音等搜索出来。

  针对教育领域内中学生的学习“痛点”,科大讯飞消费者BG副总裁章继东详细拆解了讯飞学习机X1Pro的功能,“AI精准学习系统”能根据数理化科目的知识点,定位学生的弱项,归纳形成错题本;还能辅助学生从“听、说、读、写”四个方面,提升英语的综合语用能力等。

  产品切入到行业及C端用户场景中,是科大讯飞推进创新技术应用落地的重要环节,但与此同时,它还担负着另一份企业责任:帮助在讯飞开放平台上的开发者成长,为之提供自然的人机交互生态。

  此番讯飞全新的智能物联网操作系统iFLYOS2.0的发布,在胡郁看来,可以更好的服务开发者,支持其深度自定义,“我们希望让开发者使用自己的用户体系,集成自己的服务和凸显自己的品牌元素。”

  据胡郁介绍,该系统平台不仅有毫秒级的唤醒、识别、合成,还有21种方言支持,语音识别准确率为98%,支持全双工交互。另外,在内容生态方面,它还搭载了200+技能、100+内容合作方、1500万首正版音乐、1200万小时的有声内容,同时,依靠科大讯飞提供的开发技能方案,及快速落地硬件的公版小飞AI助手,从立项到落地总用时三个月。

  商业模式寻创新

  在胡郁看来,科大讯飞作为一家20年历史的技术创新型企业,但以B端服务见长,“跟最终的消费者之间距离很远”。

  尽管科大讯飞以其智能语音与人工智能技术作为核心竞争力,但创立之初的前十年,它的目标受众一直是B端客户,普罗大众能够感知其AI能力的途径,也只有讯飞输入法、讯飞听见等移动端的录音转文字功能的App。

  胡郁以iPhone为例强调,“伟大的技术需要伟大的产品来实现落地,这才能够真正产生一个伟大的公司。”他认为一个具备核心技术的公司,其创新能力可分为三部分,首先是针对源头核心技术的系统创新,其次是提升产品能力的产品创新、应用创新和微创新,最后便是能够为企业真正创造价值的商业模式创新。

  回归到科大讯飞自身,虽然是一家技术型企业,但只有技术创新能力是不够的,其发展过程中的产品创新能力和商业模式创新能力都要逐步增强,才能支撑其长远发展。“除了像英特尔、高通这样的技术服务提供商,如今大部分企业都需要以核心技术为基础,转型成为方案或产品提供商,这才是决定企业在市场竞争中胜负的根本。”胡郁指出,科大讯飞已经迈过了前两个层面的创新,当下正积极迈向直接触达消费者的产品市场,探索商业模式层面的创新阶段。

  不过,胡郁也坦陈,从ToB转向ToC,科大讯飞面临的挑战巨大,“它的氛围和文化不太一样”。他认为,做一个C端产品不再是由管理者决定,反而是由直接接触到用户的产品经理来决定产品结构,属于一个扁平化的模式。

  胡郁说,文化氛围的差异化建立与营造,甚至是员工的激励方式上,科大讯飞都在做加法。

  谈及眼下AI领域的市场竞争,胡郁坦言,当前的技术发展正日趋成熟,企业间的竞争已非局限于技术层面,更关键的是谁能找到像语音智能化应用的切合点,并不断做出在某些场景针对用户有价值的产品或整体解决方案。

  从当前科大讯飞的商业逻辑来看,不难判断,它正以B端和C端并行的模式来构筑AI生态系统,胡郁也深知其会面临的风险,“能不能下定决心在这方面大规模的投入,对我们来讲是一个系统性的风险。”

  不过,从刘庆峰在2018-2019年度总结大会上的分享,“规模深耕期,赛道要控盘,应用上规模,效益要起飞”中不难预知,科大讯飞在2019年的目标十分明确,就是要通过战略转型实现经营突破。

  迈入2.0时代有目标

  作为科大讯飞的领头羊,刘庆峰心里深知,历经数十年发展的AI在未来的技术突围上需要跨越一些鸿沟——“多模态拟人交互、常识推理突破和通用人工智能。”基于他的这一判断,未来万物互联时代的语音智能化会怎样,也就有了可想象的空间。

  刘庆峰认为,将来语音交互要能真正达到准确、全面、拟人,特别是复杂场景语音识别准确率需要达到98%以上;还要真正利用小数据快速学习行业知识,实现认知智能应用的落地;再者就是结合脑科学的研究,真正实现常识推理等任务突破。

  相应的,这一行业预判也给扎根在技术和产品端的企业参与者们提出了更高要求。在刘庆峰看来,既需要算法在小样本和个性化问题上的持续突破,同时也要在脑科学研究和数学统计建模方法上的“脑智同飞”,其次便是人工智能系统和人类行为协作的人机耦合方式的探索。

  刘庆峰将2019年视为科大讯飞人工智能战略步入2.0时代的一年,他认为,这一年里人工智能将会出现规模化应用落地,“人工智能的黄金收获期将从2019年开始。”

  基于此,他在原有的“核心技术领先、用户规模增长、收入毛利增加”三项任务基础上,为步入2.0时代的科大讯飞新增了一项任务——人均效益提升,在刘庆峰看来,“讯飞的企业使命,就是让机器像人一样能听会说,能理解会思考,用人工智能来建设美好世界。”

  (钱方/文)

(本文来自于经济观察网)

科大讯飞 刘庆峰 讯飞

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 06-11 元利科技 603217 54.96
  • 06-11 松炀资源 603863 9.95
  • 06-04 卓胜微 300782 --
  • 06-04 国茂股份 603915 --
  • 06-03 红塔证券 601236 --
  • 股市直播

    • 图文直播间
    • 视频直播间