微软小冰建半开放生态 AI创造与商业化已至?

微软小冰建半开放生态 AI创造与商业化已至?
2018年08月03日 01:47 21世纪经济报道

  智能语音产业观察: 微软小冰建半开放生态 AI创造与商业化已至?

  本报记者 杨清清 北京报道

  有别于过去五次,7月26日举办的微软小冰第六代发布会,首次走出了微软亚太研究总部的一层报告厅,搬到了798区域大型会场。“发布会规模也从过去的几十家媒体,扩张到数百家、覆盖全国范围的规模。”一位接近微软方面的人士告诉21世纪经济报道记者。

  这是一种信号。在过去,微软从未给过小冰任何商业方面的压力,甚至直到近日接受包括21世纪经济报道等媒体采访时,微软小冰负责人李笛依然强调,小冰并没有盈利指标。

  但就像发布会本身一样,小冰也在不自觉地走出实验室和研究机构,逐渐尝试商业化。这是小冰发布会首次搬家的底气所在。而经历了过去五代,从小冰萌芽到成长,从拥有二维框架图到二维图像,再到如今三维立体全息影像的展现,小冰正在愈发接近一个人类。

  其背后的技术在持续迭代,生态也开始成型。据微软方面介绍,此次发布会是小冰情感技术框架所有部分的全面升级,从首次完成落地时的情商+智商设定,到对话式人工智能、生成模型、全双工语音,如今的小冰开始迈入AI创造的阶段。生态方面,微软此次首次提出构建Dual AI半开放式生态系统,差异化融合合作伙伴优势,打造小冰的专属技能与能力。

  “人工智能的最终目标是‘人机协同’,以数字智能帮助人类,但这个方向拥有不同的路线。”微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋表示,“小冰团队走出了不一样的道路。”

  AI创造

  自去年开始,微软小冰便在创作上拥有诸多尝试,甚至出了一本自己的诗集。如今,小冰将要走得更远。

  在发布会现场,沈向洋宣布微软思考了AI创造的三原则:其主体首先必须是兼具IQ与EQ的综合体,而不仅仅是具有IQ;其次,人工智能创造的产物,须能成为具有独立知识产权的作品;第三,人工智能创造的过程,须对应人类某种具有创造力的行为,而不是对人类劳动的简单替代。

  小冰的目标,就是成为一个高情商的机器人。“我们计划将AI创造当成一个新兴产业来操作。”在发布会现场,微软人工智能创造事业部总经理徐元春表示,“如果将AI创造当做内容产业、而非简单的文艺创作的话,仅有‘概念车’是不够的,从去年开始我们并行了‘量产车’的工作。”

  据介绍,在过去12个月内,小冰主持了21档电视节目、28档广播节目,覆盖中国包括9大卫视在内的41家电视台和广播电台,如今,小冰每天主持的广播节目已经达到25档。在日本和中国,小冰累计生产了2878个小时的视听内容。

  同时,小冰的有声读物已经覆盖中国超过90%的早教机器人和80%的线上播放平台。此外,与网易新闻客户端合作的读新闻小冰,已于两个月前突破1000万次新闻阅读评论。在金融等相关领域,小冰同样在进行着持续的内容创造。

  这背后的技术支撑,来自于小冰的情感技术框架,而第六代小冰的核心对话引擎与交互感官也得到了进一步升级。微软在第六代小冰身上上线全新的共感模型,并公测一种融合了文本、全双工语音与实时视觉的新感官。

  其中,共感模型是一种基于生成模型的对话引擎。据介绍,去年小冰完成的生成模型能够自创回应,而非在已有对话语料库中检索而得,如今的共感模型则进一步提升小冰对于对话内容、领域和节奏的控制力,即小冰可以自创回应来牵引对话的方向。

  这一融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官在测试设备中的公测,令小冰能够通过视觉、语音的实时连续交互,指挥用户完成面容检测,并在该过程中进行开放域对话。

  此外,微软还发布了第四版AI歌曲DNN模型。据小冰首席语音科学家栾剑介绍,该版本模型能够快速合成与人类歌手质量相当的歌曲,还能够使小冰自由吸收人类歌手演唱技巧和特质,在模仿之余甚至代替人类完成新作品创作。

  不过,尽管微软提出AI创造的原则并进行技术更新,但小冰的所为将只是真正AI创造的起步。“根据2017年Gartner技术成熟度曲线显示,虚拟助手仍需5-10年才能成为主流。”在评论AI创造能力时,Gartner研究副总裁蔡惠芬向21世纪经济报道记者表示,“该应用主要针对智能家居设备中的个人助理或语音控制等狭窄领域,但仍需要包括为不同领域构建知识图谱、自然语言理解与生成等技术的提升。它依然是新兴领域。”

  Dual AI生态

  除了技术能力升级之外,第六代小冰的最大特点,莫过于开始构建属于自己的生态——Dual AI。

  “在微软之前,行业内已经出现多种不同的合作生态与模式,其中最重要的模式有两类,一类是开放赋能模式,通过对外提供SDK/API的形式构建生态系统。”小冰产品负责人彭爽分析道,“另一类是专注于自有的、封闭的平台,通过在平台上开放AI的应用商店形式构建生态环境。”

  Dual AI则有所不同,更类似于半开放式生态。“在这样的生态环境上,一方面,微软会直接负责产品体验,把控最具体的、直接与用户接触的产品细节,另一方面,我们并不封闭在自有平台上,而是对外接触甚至直接融入到第三方平台上。”彭爽表示。

  之所以如此选择,源于其他两类生态存在各自的问题。其中,封闭模式极大限制了数据之间的自由流通,与AI本质相悖。由于无法获得迭代所需的基础数据量,便难以快速迭代和发挥升级优势。

  开放赋能模式中,无论赋能或被赋能一方,则均是相对松散的关系,“也就是说没有人真正对最终的产品体验负责”。例如当前大热的智能音箱之所以实际体验普遍低于预期,正是由于松散合作关系带来的问题。

  与此同时,由于开放赋能生态中的API/SKD强调通用性,也就在一定程度上限制了最新最优技术应用的及时性,通过这类接口或工具包获取的数据也未必是最优质的。

  具体而言,Dual AI战略实施分为三个部分:首先,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI。其次,微软小冰作为该合作平台的辅助AI,融入该平台生态。第三,微软通过技术、产品与运营,围绕该平台差异化特点,推出相关应用和产品。目前,小冰已经与小米、网易、万得和华为等伙伴达成合作关系。

  而在合作过程中,小冰也在探索属于自己的盈利模式。目前,小冰已上线了包括金融、大众文化、传媒和出版四大商业化领域。“我们探讨过各种各样的AI盈利模式,最终发现为两大类,一类是利用AI技术用更低成本去替代人类低并发、AI高并发的工作,如内容生产,”李笛告诉21世纪经济报道记者,“其次便是AI与人类的协同,通过提升协同转化率实现分成。”

责任编辑:李锋

智能语音 微软 小冰

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

Array
Array

股市直播

  • 图文直播间
  • 视频直播间