腾讯 AI 助手元宝大升级!除了能搜公众号,跟其他国产 AI 搜索有什么不同?

腾讯 AI 助手元宝大升级!除了能搜公众号,跟其他国产 AI 搜索有什么不同?
2024年07月04日 18:52 爱范儿

5 月 30 日,腾讯的 AI 助手应用「腾讯元宝」上线。因为可以引用公众号文章,内容生态质量较高,AI 搜索赛道虽然卷生卷死,姗姗来迟的元宝仍然被看好。

7 月 1 日,元宝迎来大升级:上线「深度搜索」模式,手机 app 更新到最新版本即可使用。

所谓的「深度搜索」,其实就是让 AI 助手更聪明,延伸你的问题,回答得比基础搜索更广泛和深入,还能同步生成内容大纲、思维导图等 J 人狂喜的格式。

这听起来有点耳熟,国内外的 AI 搜索都有类似的功能——Perplexity 的「Pro」搜索、秘塔的「深入」和「研究」搜索,天工的「增强」和「研究」搜索……

总是略慢半步的元宝,能否真的后来居上?

认真答题还是狂水字数,只有一线之隔

首先需要说明,「深度搜索」不是事先可选的模式,元宝先照常回答你的问题,再有几率提供「深度搜索」的一键生成选项。

比如,当我给元宝发个链接,让它总结公众号文章的内容,「深度搜索」就没有出现。

接下来正式开始,先来一个热身题:City 不 City 是什么梗?

这个梗出自外国博主@保保熊,形容一个地方城市化、现代化、洋气,借着最近外国游客到中国旅游的东风,席卷了互联网。

元宝精准地找到了梗的出处,解释了基本和引申含义,以及它如何被更多短视频化用。参考的资料还很新鲜,其中一篇公众号文章,就比我发出问题早了 2 个小时左右。

不过,这是元宝用基础搜索就可以做到的事情,重头戏是一个金光闪闪的选项——「深度研究该问题」。

点击一下,元宝直接呈上了一份研究报告,不厌其烦地解释了这个梗的流行原因和社会影响,列出了大纲、脑图、相关人物。

但是,元宝的回答太啰嗦了,段落之间不少意思重复的表达,仿佛本科学生论文,挤一挤都是水分。

▲ 4 张截图也截不完!

▲ 4 张截图也截不完!

然后,我拿同样的题目,用秘塔的「深入模式」再搜索了一遍,给出的结果也有大纲、脑图、相关事件和人物等,甚至还能生成 PPT,但看着更言简意赅,重点也没有遗漏。

▲ 图片来自:秘塔

▲ 图片来自:秘塔

选择秘塔作为对照组,是因为它在国产 AI 搜索里口碑较好,引用信源丰富,也支持脑图和大纲。拿秘塔的「深入模式」和元宝的「深度搜索」对垒,相对公平。

再来一个进阶题:2024 年 6 月,海内外的 AI 生成视频工具有哪些重大的进展?

元宝先拒绝回答,说这是「未来」的事情,叫我自己动手。哪怕训练数据没有那么新,但它可以联网搜索啊!当我提醒了元宝,它终于反应过来,列出了可灵、Luma 等工具。

然后再进行「深度研究」,元宝乱答一通,可能因为对提示词和上下文的理解混乱,同时回答了我两个问题:哪些 AI 可以联网搜索,以及 AI 生成视频工具的发展情况。

理解能力比较松弛,但延伸角度又弥补了这一部分,元宝介绍了其中一些工具的具体使用方法,并且思考了 AI 生成视频可能存在的风险,又实用,又懂升华。

再用秘塔的深入模式搜索,一次输出的答案就很不错,每个工具的发布都标注了时间,旁边的大纲引申到了更多非六月发布的工具,以及对整个行业的展望,详略得当。

▲ 图片来自:秘塔

▲ 图片来自:秘塔

其实在体验过程中,元宝的「已读乱回」不只出现了一次。

当我提问全球首款集成 GPT-4o 的智能眼镜,在「深入搜索」模式下,除了眼镜本身,元宝还介绍了 GPT-4o 在其他领域的应用,甚至提到了 GPT-4o 的竞争对手 Gemini。

如果我是阅卷老师,会觉得 AI 是在堆砌材料,有偏题嫌疑。同学,我们的核心是智能眼镜,要么纵向介绍发展历史,要么横向比较竞品,而不是疯狂拓展支线剧情。

接下来试试元宝的舒适区。腾讯说了,在科研、财经等专业场景下,深度搜索的效果更突出。所以,来一道学术型的题目:近期的多起 Manner 咖啡员工与顾客冲突事件,可以用哪些社会学理论解释?

这一次,元宝回答得还不错,提到了异化、情绪劳动、资本监控和劳动者困境等理论,并引导我们思考:Manner 事件是否反映了更广泛的社会问题?

再把问题交给秘塔的深入模式,搜索范围选择学术,回答得比元宝思路更开阔、更能扯淡,看起来学术含金量更高。

▲ 图片来自:秘塔

▲ 图片来自:秘塔

根据以上题目的测试结果,再结合使用感受,小结一下深度搜索的特点:

1. 并非每个问题都需要深度搜索,有时反而显得信息冗余、逻辑杂乱、重点不突出。

2. 在有限的题目范围内,元宝的深度搜索表现不如秘塔的深入模式。(欢迎大家提出自己的意见)

3. 元宝的参考资料是第三方网站以及公众号文章的混搭,在有限的题目范围内,公众号生态没有体现出明显优势,高质量的信源固然重要,但模型能力也重要,对上下文的理解出错,直接拉低输出结果。

4. 深度搜索的加载速度慢,字数又多,生成近 3000 字的完整答案需要 1 分多钟,等得让人心急,如果想要边看内容、边等待加载完毕,操作也不太方便。

AI 搜索,让少数的问题被更多地思考

不约而同地,AI 搜索产品都在往更纵深的方向卷,「深度搜索」「研究」「增强」……

这些不明觉厉的前缀,明确了 AI 搜索的定位。它们不完全取代传统搜索,而是有自己的赛道,更深入理解用户的查询意图,提供更精准完整的搜索结果。

数据显示,当前在大模型相关产品的使用中,超过 65% 的用户需求集中于提升工作与学习效率,其中「搜索问答」需求占比高达 45%。

如果只是在手机上找到某个网站、某条新闻,AI 搜索和传统搜索差别不大。

比如,相比通过输入「7 月 4 日生成式 AI 大事件」、在腾讯元宝了解今天的大新闻,我觉得还是爱范儿和 APPSO 的早报更有价值。

人类编辑的信息筛选、总结乃至排版审美,更胜满屏都是字的 AI 一筹。

但找到和某个主题相关的文章、视频、图片、数据,对播客、论文等针对性搜索,生成调查报告、思维导图和 PPT,就是 AI 搜索的强项了。

AI 搜索不仅是搜索,也是研究和总结,有些像我们编辑把选题扩展成提纲再写成文章的过程。

基于这个角度,我向元宝提问:介绍几款类似网易有道 Echo 的海内外 AI 口语教学 app。

提问的是事实本身,我想知道,进行深度搜索后,元宝的延伸角度会是什么,能否抽出一些可用的观点?结果比较常规,还是围绕着某个 app 的特色功能、收费标准。

我决定进一步追问,把这些 app 关联起来:这些 AI 口语教学 app 有哪些共同的特点?反映用户对口语学习的什么需求?

这次,元宝给我的答案好多了,总结了个性化学习、即时反馈、模拟真实对话场景、学习资源丰富等特点。

延伸角度也有意思,变得更加具体可感,关注到了时效性,以及用户群体:2024 年最新的 AI 口语教学 app 有哪些新技术应用?哪些 AI 口语教学 app 适合初学者使用?

AI 搜索查找资料的能力固然强大,但也要我们引导,才能给出有用的「你可能还想知道」「你可能还想问」。在这个过程里,我们也在思考。

AI 搜索头把交椅 Perplexity 的 CEO 在专访中说过,大多数问题只需互联网搜索就能解决,少数问题要额外思考。

这个观点很适合用来破解 2024 年的一道高考作文题:随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?

古希腊哲学家芝诺将人的知识比做圆圈,圆圈里面是已知的,圆圈外面是未知的,我们知道的东西越多,圆圈也就越大,外沿也就越长,我们不知道的也就越多。

因为 AI,得到答案的过程更快了,同时也有更多问题随之而来。也是因为 AI,那些少数的、需要额外思考的问题,我们可以走得更远。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片