转自:千龙网
华为开发者大会2022(Together)(以下简称HDC 2022)正式拉开帷幕,作为华为面向开发者群体举办的科技盛宴,每年在大会期间总能看到各项新成果、新技术、新开放能力的公布,既给消费者带来新的功能升级,又会为开发者带来更加高效便捷的应用开发体验。
今年在大会现场记者就看到了华为阅读带来的两大全新功能,着实引人瞩目:一是人物图谱,二是WebBrain搜索。
阅读,是大家在高效利用碎片时间的常见选择之一。我们经常能看到有人在公交车和地铁上用手机进行阅读,或者为自己“充电”,或者就是放松一下心情。但是,在阅读很多大部头作品时,书内人物众多,关系又错综复杂,再加上都是碎片时间进行阅读,很难理得清书中的人物关系,或者读到后面在书中提及早前的情节时已然忘记了之前的故事,只好回头再翻阅前文帮助回忆,如果阅读的是外国作品,更有可能连人物的名字都混淆不清,这阅读体验着实让人感到不便。
华为阅读新推出的人物图谱功能就可以很好地解决这样的问题。人物图谱,可以自动帮助读者生成“人物关系图”,帮助大家迅速理清人物之间的关系,点击相关人物就能看到人物介绍,以及某个人物出现的章节,可以迅速帮助读者扫清阅读障碍,沉浸到故事当中。
人物图谱,很像在学生时期会将一章节的内容浓缩成知识要点。这种技术在AI领域也被称为“知识图谱”。为了实现阅读助手中的“知识图谱”,华为阅读、华为云、伦敦研究所等联合进行研发,用百万本小说训练数据集,训练十多个AI 算法模型来构建;同时使用支持百亿规模数据集图谱的基础设施,能实现毫秒级图谱查询。同时,“章节索引”功能基于10亿参数600G训练数据的NLP大模型,通过语义匹配算法,构建高精度的段落提取模型,内容理解准确度提升30%。
我们在使用阅读应用时,对于不认识的英文单词、不认识的汉字已经可以便捷的进行查询扫盲了。但是,如果阅读时遇到了一些不了解的知识点,或者不了解的名词就还是要跳出阅读环境,去求助于百度等搜索引擎获取相关信息,阅读体验就会被迫中断。
WebBrain搜索技术正是为了解决这样的问题而诞生的,WebBrain搜索是华为2012 实验室研发的检索增强生成模型,模型通过检索增强技术RAG和自然语言生成技术NLG实现端到端的权威知识的搜索与生成。模型在检索部分的主题相关性检索技术,在千亿网页中精准检索到用于生成答案的全面的网页证据和片段。在生成部分,采用多源信息编码融合技术将检索回的文档融会贯通,对检索回的文档进行多源信息融合,让答案突破输出长度限制,将检索文档去粗取精,选择高质量片段进行融合表示并生成出内链和外部文档引用;同时智能事实核验技术对生成的答案,包括内部链接及外部文档引用,进行相关性、流畅性、权威性、完备性等多方面核验,使得模型生成权威的自然语言回答。
比如这句话“在奥地利与普鲁士战争期间……”,如果不了解奥地利与普鲁士的历史,就很难做出准确理解,在WebBrain搜索技术的帮助下,用户选中“奥地利与普鲁士战争”关键词进行搜索,就会跳出对这一世界历史事件的详细介绍。相当于在一些知识难点上自动为用户加了注释一样,不需要跳出阅读过程,帮助理解之后,可以快速返回阅读过程,继续阅览。
阅读是智能手机使用的高频场景,但是它又只是一个小小的功能,为了提升用户的使用体验在这样的细微之处,华为阅读也在不断提升从语言读书到随手记录读书笔记,现在又将AI能力引入其中,都是为了让用户获得更好的精品阅读内容和服务,这样持续升级的阅读体验才会让用户更愿意欣然使用。
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)