一度蜜科技：虚拟角色未来会颠覆教育媒体娱乐行业_新浪财经

“只有潮水退了才知道谁在裸泳”，一张榜单尽显中国经济的“大事”与“大势”！ “2018十大经济年度人物评选”火热进行中！【点击投票】Pick你心目中的商业领袖

　　新浪财经讯 11月20日消息，由《中国经营报》与北京大学国家发展研究院联合主办的“2018中国企业竞争力年会”在京举行。一度蜜科技董事长和晶出席年会并发表演讲。和晶表示，虚拟角色继续扩张，未来会颠覆教育、媒体、娱乐行业。

　　谈及转行的原因，和晶表示传媒行业很多的工作慢慢会被机器所代替。

　　和晶表示，一度蜜科技目前正在研发数字虚拟主持人。在未来做可视化和智能交互的数字人物背后，需要完成三件事，即语音、表情和动作。

　　她认为，如果虚拟角色的这个能力继续得到扩张，未来会颠覆教育、媒体、娱乐行业。

　　以下为和晶演讲全文：

　　各位朋友，大家好！媒体圈的朋友，大家好！其实我现在的身份是科技公司董事长，我原来的身份是《实话实说》的主持人。从做主持人的这20年的经历当中，我们很多主持人最后都去转行了。转行的原因就是我觉得在传媒这个行业，很多的工作慢慢会被机器所代替。当然，我转行的时候还没有讲到这个。

　　刚才我听到他们演讲的时候，我觉得可能我跟前面的几位CEO都不太一样。因为我讲的是基于我们现在正在做的现在和未来。现在其实北京的朋友应该都知道，原来我们特别喜欢跟北京的出租车司机聊天，是因为原来北京的出租车司机他们都特别爱讨论国家大事。然后，你们有没有发现，最近司机们谈论的主题已经变成了人工智能，这可能在世界上只有北京的司机素质这么高。

　　其实主要的原因可能因为这几年由于人工智能的热词开始浮出水面。所以，很多的大众也开始关心这个话题。那么，我作为一个科技公司的董事长，我这七年在干什么呢？其实我没有在做刚才大家说的为C端服务的很多事情。我们在做的其实是一种孵化和研发，主要是针对数字虚拟世界的。我这样讲可能觉得你作为一个主持人，你凭什么能讲数字虚拟世界。我讲的就是数字虚拟主持人。

　　那么，在前一段时间我们看到一条新闻，大家都特别震惊，说有一个智能主播出现了，其实那个是目前来讲很多公司都有的技术，它可以在一个虚拟的人物身上输入这个原型人物的声音，把文告输入，机器就可以读出来，今天我们可以现场尝试一下，或者我给大家带了几个例子，我们可以现场看一下。

　　第一，我们先来了解一下数字化人物。我暂时用主播这个词，它的语音部分。我们先做一个简单的测试，我现在给大家听两条语音，你们能分辨出来是谁的吗？

　　（播放语音）

　　这是陈铎老师，很多年轻朋友可能不是很熟悉。我觉得40岁朝上的朋友听过陈铎老师的很多配音，我没有说第二条是谁。

　　（播放语音）

　　这是谁的声音？任志宏。我前面给大家放的是原型声，陈铎老师的声音还有任志宏的声音。刚才说是回答任志宏的那位先生，你的年龄跟我差不多了，暴露了年龄，我看很多90后的小朋友应该都不知道。任老师的声音识别度非常高，而且他在很多的纪录片配音里边我们总是听到这个声音就知道他是谁。

　　那么，接下来我们要跟大家讨论的就是说，我们可不可以把任志宏老师的声音，因为他现在很忙，工作也很多，年纪也大了，我们可不可以让他的声音让机器来进行配音，而不是他本人呢。我们就做了这样一个路径的尝试。也就是说，在未来我们做可视化和智能交互的数字人物的这个背后，我们可不可以完成三件事。第一，语音。第二，表情。第三，动作。现场的文科生多，所以我也是文科生，你们不要紧张，我讲的一定大家都能听得懂。在语音的部分，我们第一步要做的是原音的采集，也就是说，我们先把，比如说我，先把我原来的声音采进去，采完声音之后，我们来看一下它有一个训练与应用的流程，在这个里边就要从文字到因素，然后音频分隔，音频合成，这个里边还要做特征的提取，整个的技术路径是这样的。那么，大的顺序就是我们在语料库先进行采集，建立机器的神经网络，训练文本到模型，进行小样本的学习，最后出现比如我的声音。我今天不能用我的声音是我自己在做这件事情，万一我作弊，大家没有办法来论证，不公平。所以，我今天没有用我的声音。

　　那么，有的人会说，现在的机器学习的声音他的原料、语料多长时间就可以用他的声音来说了呢？有的公司说，他们用40小时就可以了，有的公司说他们用20个小时就可以了。有的公司说，我可能用两个小时就可以了。其实背后涉及到每个语音公司不同的技术投入、底层算法和它的整个神经网络的学习过程。

　　那么，现在我们可以再听一下任老师的声音，通过前面做的这些所有的技术路径，现在听到的就不是他本人的配音了。

　　（播放语音）

　　这一段，他们团队故意做了很多停顿，是因为这是一个样本，还不能拿出来用。但是，我们觉得它已经能够用任志宏老师的声音特色来读新闻。那就意味着什么呢？就是以后很多纪录片，不需要情感起伏太大的，或者不需要浓烈的这种情感表达的，比较平稳的这种配音或者说这种播报，其实已经可以做到了，现在的技术已经可以做到了。那就意味着我们做新闻配音的很多主播真的要失业了，但是前提是要做到前面我说的那些学习路径。

　　我们说你看作为一个虚拟人物，他声音的部分解决了，虚拟人物还有很多表情，脸上还要有表情，说话还要有口型，这个怎么解决呢？我们也做了视觉部分的研发和开发。现在我们看一下，如果我们通过角色的语言特征，通过对话、文字、影像不同的形式输入进去，也是要输入进去的，然后有分成六层进行学习，在这个学习之后，我们就会先有口型出现，人物模型的口型就出现了，这是我的嘴，当时采的是我说话的嘴型。一直到这边说话的嘴型当时都是抓取我的脸部的特征。在模型学习口型之后，我们发现一个数字模拟人在视觉部分，如果你要去说话，或者是说表达，这个口型基本上就能对上了，讲话的时候要对口型。对完口型之后还有动作，动作现在也有很多可以让他学习的整个的过程。

　　但是，你可以配音，也可以说话，然后也可以用面部表情，你和别人交流的时候是不是得有个性，比如我和你交流，我和你人机对话，和陈伟（音译）你跟别人对话，我们两个人语言不同，所以在对话过程中会产生不一样的反映，就有一个虚拟人物的知识体系的构建。在这个过程当中，我们也要做到很多步骤，在这些步骤当中，要先从语音开始，嘴型开始，还要沉淀很多数据，包括还有在整个过程当中进行训练，反复的训练，然后最后的这个动作还要有一个重新的定向，会到我们角色动画的抓取上面去。整个的这个过程没有我说的这么简单，但是从技术路径上来讲，我们的技术团队其实都已经可以把它完成了，都已经可以做到了，只是我们还需要时间。

　　所以，如果我们以后是有这样一个对未来虚拟人物的想象，或者说愿望，我们基于虚拟角色的这个能力继续得到扩张，未来真的会颠覆教育、媒体、娱乐这个行业。其实现在娱乐行业很多已经特别享受到这样的人物的魅力了，“初音未来”我曾经看过他们的演唱会，现场的狂热程度简直就是我很少看到过的。

　　刚才我讲，有了嘴型、面部的抓取，多层的学习之后，我们还需要有一些训练，这个训练是要有脚本的。我们会给这个人物做一些人工编排的一些脚本，有基础，然后还给他一个脚本生成的过程。然后，最后是一个动态的，动态的这个其实现在我们做数字人物的过程当中很多公司也都做的很好了，我们通过人物的抓取，动作的抓取，皮肤的复原，骨骼的动作，也基本上可以把一些简单的动作做出来。其实最难的是最后那个交互的部分。

　　这个要放一下，用这个简单的给大家表述了一下我们怎么把虚拟人物的身体、脸给构建出来。这个还是在电脑里做的，所以只是为了抓嘴型和脸型，所以最后那一张还不是恢复到我本人的脸部状态。

　　但是前两天正好我有一个好朋友也是主持人，李静，她也是一个企业家，她说我们根本没有时间见面，她忙的要命，我说忙什么呢？她说你看吧，她在录一个节目，一个课程，当然现在语音课程特别赚钱，但是现在语音课程必须本人要去录制，原型人物去录制，所以她要特别辛苦先把课程写下来，然后去录音棚里录制。我当时跟她开玩笑，我说其实你只要有一个10-20个小时的原始的语音的录入，你后面的课件把稿子给我们就好了，我们就给你生成你的声音。所以，接下来我们在做的事情都是基于能够在虚拟人物的语音、形态、动作方面进行开发和把它产品化。

　　今天简单讲这些的原因是因为我这个人特别老实，当时邀请我的时候说1/3说共话，2/3说一下未来，就是基于今天科技你们在做的一些未来。所以，我基本上2/3都留给讲我们现在正在做的事情和很快就会呈现出来的模样。我没这个本事，不是我自己能够做成这一步的，我们的合作团队是中国科学院自动化所的一个科研团队，我们作为一个企业，我们拨出了一部分的经费和人员和团队一起进行主持人虚拟角色的开发。所以我觉得在语音部分既然已经攻克了，下一步要攻克的就是嘴型和动作的部分。我其实自己心里有一个感触，七年的时间里，很多人会跟我说，你是主持人里面最懂科技的。我跟科技圈里的人相处，他们说你是科技圈最会做主持的。所以，我有责任把这两个范围里的人做一个角色的转换。我在这个过程当中有一个很深的忧虑，很多人说如果科技用在一个价值观或者伦理感很低的人手里，真的可能会给我们的社会带来一些不好的趋势，甚至说一些危机。我觉得最近大家也看到了很多新闻，也有一些很恐怖的预言，就是人工智能最后会干掉人类，这些都会存在。

　　我在跟我们的科研团队和跟其他科研团队打交道的时候我也问过他们这个问题，虽然对我们来说，我们会说这个过程是一个非常漫长的过程，也不是说我们今天自己的脑子想象就可以把它完善的过程。但是，有一点是确定的，这也是一个今天跟大家分享最后的一个价值观，就是我希望在座的各位多多接触一下科技，多多学习一下科技。然后才能更好的理解它，然后我们让更多善良的人，心存美好的人，更多的去运用科技，我觉得这未来可能会让我们有一个安全、美好的走向，谢谢大家！下一次的主持可能就是一个虚拟的主持人为大家在播报和主持了。谢谢！

　　姚长盛：谢谢今天科技竞争力企业为大家做的这一段一段的分享。上午跟下午的论坛风格截然不同，上午更像是这些大树的一些招摇，所以第一个论坛对2019年会充满一些悲观，后面看到那么多民营企业家都在分享自己的一个一个心得，无论是法制，还是市场化，还是最后宗庆后提出的让大家勤劳致富，我想这是大树做出的呐喊和回应。今天下午很有意思，跟我们上午听到的没有关系，所以不光是一个伟大的企业，最终都是要解决一个重大的社会问题，还是说我们要相信“相信的力量”，总之，我们这个论坛都是希望大家能够有更多的信心，也希望大家能够过得更好，我们今天论坛告一段落，谢谢各位！明年再见！

责任编辑：万露

我要反馈

相关专题： 2018中国企业竞争力年会专题