华为开发者大会展示黑科技：小说能自动生成人物关系_新浪财经

转自：千龙网

华为开发者大会2022（Together）（以下简称HDC 2022）正式拉开帷幕，作为华为面向开发者群体举办的科技盛宴，每年在大会期间总能看到各项新成果、新技术、新开放能力的公布，既给消费者带来新的功能升级，又会为开发者带来更加高效便捷的应用开发体验。

今年在大会现场记者就看到了华为阅读带来的两大全新功能，着实引人瞩目：一是人物图谱，二是WebBrain搜索。

阅读，是大家在高效利用碎片时间的常见选择之一。我们经常能看到有人在公交车和地铁上用手机进行阅读，或者为自己“充电”，或者就是放松一下心情。但是，在阅读很多大部头作品时，书内人物众多，关系又错综复杂，再加上都是碎片时间进行阅读，很难理得清书中的人物关系，或者读到后面在书中提及早前的情节时已然忘记了之前的故事，只好回头再翻阅前文帮助回忆，如果阅读的是外国作品，更有可能连人物的名字都混淆不清，这阅读体验着实让人感到不便。

华为阅读新推出的人物图谱功能就可以很好地解决这样的问题。人物图谱，可以自动帮助读者生成“人物关系图”，帮助大家迅速理清人物之间的关系，点击相关人物就能看到人物介绍，以及某个人物出现的章节，可以迅速帮助读者扫清阅读障碍，沉浸到故事当中。

人物图谱，很像在学生时期会将一章节的内容浓缩成知识要点。这种技术在AI领域也被称为“知识图谱”。为了实现阅读助手中的“知识图谱”，华为阅读、华为云、伦敦研究所等联合进行研发，用百万本小说训练数据集，训练十多个AI 算法模型来构建；同时使用支持百亿规模数据集图谱的基础设施，能实现毫秒级图谱查询。同时，“章节索引”功能基于10亿参数600G训练数据的NLP大模型，通过语义匹配算法，构建高精度的段落提取模型，内容理解准确度提升30%。

我们在使用阅读应用时，对于不认识的英文单词、不认识的汉字已经可以便捷的进行查询扫盲了。但是，如果阅读时遇到了一些不了解的知识点，或者不了解的名词就还是要跳出阅读环境，去求助于百度等搜索引擎获取相关信息，阅读体验就会被迫中断。

WebBrain搜索技术正是为了解决这样的问题而诞生的，WebBrain搜索是华为2012 实验室研发的检索增强生成模型，模型通过检索增强技术RAG和自然语言生成技术NLG实现端到端的权威知识的搜索与生成。模型在检索部分的主题相关性检索技术，在千亿网页中精准检索到用于生成答案的全面的网页证据和片段。在生成部分，采用多源信息编码融合技术将检索回的文档融会贯通，对检索回的文档进行多源信息融合，让答案突破输出长度限制，将检索文档去粗取精，选择高质量片段进行融合表示并生成出内链和外部文档引用；同时智能事实核验技术对生成的答案，包括内部链接及外部文档引用，进行相关性、流畅性、权威性、完备性等多方面核验，使得模型生成权威的自然语言回答。

比如这句话“在奥地利与普鲁士战争期间……”，如果不了解奥地利与普鲁士的历史，就很难做出准确理解，在WebBrain搜索技术的帮助下，用户选中“奥地利与普鲁士战争”关键词进行搜索，就会跳出对这一世界历史事件的详细介绍。相当于在一些知识难点上自动为用户加了注释一样，不需要跳出阅读过程，帮助理解之后，可以快速返回阅读过程，继续阅览。

阅读是智能手机使用的高频场景，但是它又只是一个小小的功能，为了提升用户的使用体验在这样的细微之处，华为阅读也在不断提升从语言读书到随手记录读书笔记，现在又将AI能力引入其中，都是为了让用户获得更好的精品阅读内容和服务，这样持续升级的阅读体验才会让用户更愿意欣然使用。