谷歌都未能攻克的企业内搜索为何这么难做？

Glean是一款基于AI的企业内部搜索和知识管理平台，成立于2019年，起步于企业内部搜索，通过结合LLM的能力以及与超过100个SaaS应用连接，让用户不仅可以获得个性化的搜索结果，而且可以实现跨应用搜索企业内的数据，被视为在企业内AI搜索方向目前最前沿的公司。

Glean创始人Arvind Jain曾在Google工作超过11年，担任算法工程师，离开谷歌后创办云数据管理平台Rubrik。前不久Arvind Jain在播客节目《Trainning Data》中分享了Glean在构建企业内AI搜索的经验，其中特别谈到其产品究竟难在哪里。我们整理和翻译了部分内容，原播客内容可以点击「阅读原文」链接跳转收听。

图｜播客 Shownotes

📝 内容摘要

1. 数据基础设施：构建有效的AI应用需要强大的数据基础设施，包括与企业系统的深度集成、安全和权限框架，以及理解人与内容关系的复杂知识图谱。

2. AI理解企业内容的重要性：企业搜索和AI应用需要理解组织结构、用户角色和访问权限，构建上下文理解，这对于提供相关结果至关重要。

3. 学习人类行为：优秀的AI系统能从人类的工作方式中学习，追踪文档接触和沟通工具中的互动，以提高系统的相关性和有用性。

4. 从明确价值开始：先通过核心功能，如企业搜索为用户提供明确价值，再扩展到更多AI功能。这种方法能够建立信任并为高级功能提供数据基础。

5. 自主AI助手：AI的下一阶段是主动的AI助手，能够预测需求并在日常工作中提供指导，类似于执行助理。实现这一愿景需要在企业AI的基础和高级方面都表现出色。

技术难点

1. Sonya Huang：“Google for Work”，利用强大的搜索能力帮助解决工作中的问题、查找信息或提高效率是每位CIO梦寐以求的目标。然而在过去二十年来，即使是Google也未能攻克这一领域。能否简要说明为什么这个问题如此困难，以及你们是如何解决的？

Arvind Jain：搜索在某种意义上像一种“魔法”。用户可以提出任何问题，并期望系统能准确给出正确答案，因此人们的期望值总是很高。这是一个棘手的问题，尤其是在企业中。因为企业内部信息分布在众多系统中，真正掌握这些信息就已经很难，判断信息的准确性和时效性则难上加难。因此，构建这样的系统充满挑战。

解决这个问题需要投入大量的资源，而这在很多方面对初创公司并不友好。在SaaS出现之前，甚至无法构建这样的产品。仅仅是将企业的所有数据连接到搜索系统上，就需要与企业保持一整年的密切合作才能完成，更不用说如何真正让这些信息变得可被搜索了。

2. Pat Grady：Glean很有意思的地方在于，它是第一个，也是目前最成功的展示一个企业级AI应用应该是什么样子的产品。我们后面会聊很多AI相关的东西，但是我知道你们的技术栈也有很多层面的东西，有基础架构，有知识图谱等等，可以先讲讲在实现充分利用AI能力之前，你们首先需要做的是什么吗？

Arvind Jain：搜索的第一步是让数据和知识可以被搜索。所以Glean的第一步是深度整合信息。

其次，企业级搜索和Google网页搜索的区别在于，大部份的企业内的信息天然就是私密的。并不是把文件扔进公司的信息系统里，让每个人看到，就叫做搜索。而是你必须理解每一个内容的授权对象都有谁，当你要搜索的时候，系统要知道你是谁，调回的是你有权限看到的内容。这是Glean的“管理层”。在这些系统中理解这个管理权限是很复杂的。

第三，过去大部分类似产品都往往没有解决这个问题：你要知道什么文件给什么人，不是把信息列出来作为索引。比如一个职场新人来搜入职须知信息，ta是市场部的还是一个工程师？ta需要的是哪一个文件？所以，理解人和知识之间的关系很重要。所以Glean是做了一个深度的知识图谱，理解每个部门的职能以及他们的文件。构建出当一个人来搜一个文件，和ta最相关的信息是什么。

对我们来说AI是成立第一天就很重要的技术。从一开始就在理解一个用户搜索实际想要的是什么，不是把自己局限在用户的搜索关键词，这些都是在结合大语言模型之前做的事情。

3. Sonya Huang：我认为Google的核心优势之一在于它能优化搜索答案的排序，把用户最想要的信息排在最前面。在公共互联网的搜索中，这得益于庞大的网页数据和链接关系。在Glean中，你们是如何实现这一点的？

Arvind Jain：这确实是产品的核心部分，我们也投入了大量精力构建一个高效的搜索排名系统。我可以举一些例子来说明我们如何确定哪些文档在特定问题下应当被优先展示。

首先，如果有一份文档在公司内被频繁查看，这显然是一个信号，表明它具有一定的重要性，员工愿意花时间阅读它。其次，如果某份文档是最近一两周内创建的，而且有较高的互动率，这说明它是受关注的，信息尚未过时。此外，有些文档可能在整个公司没有太多人看，但在特定团队内部使用频繁，这可能就表明它跟该团队特别相关。

另一个例子是，假如有人懒得使用工具搜索问题，而是在Slack上提问，随后另一位同事会发布一个文档链接作为回应，提问者对此点赞。这种交互意味着该文档是一个很好的回答。因此当其他人提出类似问题时，系统会自动关联该文档，这会非常有用。

在企业环境中，这些有效信号的收集与网络搜索完全不同。Google是知识搜索的入口，而在企业中，很多知识获取并非通过搜索完成，因此我们需要从多个系统中分析活动数据，包括通信系统和文档管理系统，并观察员工行为模式。通过不断学习企业内部的这些行为，收集更多的相关信息，才能让排名系统更加精准有效。

Part.02

企业搜索 v.s. RAG

4. Sonya Huang：我认为Glean是让RAG（检索增强生成）真正服务于企业内容领域的专家。能否用简单易懂的方式解释一下RAG？它的运作秘诀是什么？有哪些鲜有人提及的挑战？此外，RAG能实现哪些普通聊天界面无法实现的功能？

Arvind Jain：市面上比较出名的，比如GPT、Gemini和Claude，这些模型都是基于全球公开的知识和数据训练出来的。所以，如果问ChatGPT类似“我的公司带薪休假政策允许我休假多少天？”这样的问题，它完全答不上来。因为答案属于企业的私密信息，而模型并未接受过相关训练。

为了让模型能够处理企业的私有数据并实现真正智能的回答，我们需要依靠RAG架构。RAG的工作原理是这样的：你提出一个问题，首先通过一个搜索引擎找到可能相关的文档或内容片段。接着，你将这些文档发给模型，比如GPT，告诉它，“这是我的问题，这些是我认为可能相关的企业知识，请基于这些信息回答问题。” 如今，大多数企业的AI应用程序都是基于这种架构构建的。唯一能够将企业私有数据与语言模型强大功能相结合的方式，就是通过位于中间的搜索引擎去实现。在过去五年里，我们在Glean上开发了一套基于企业内容的搜索引擎。这不仅让我们成为最好的RAG系统之一，还支持我们推出了端到端的用户应用程序—Glean助手，同时也帮助企业利用RAG构建更多的应用程序。

尽管这种架构已逐渐成为构建AI应用的标准方法，但我认为它仍然充满挑战。要使用RAG打造优秀的AI应用并不容易。首先，模型本身虽然强大，但仍属于新兴技术，比如它们会有幻觉。而RAG架构引入了另一层复杂技术，相当于将两个不够完美的复杂系统连接起来。因此，你会发现基于RAG的应用经常出现问题，比如在检索阶段未能找到正确的知识片段，或获取了过时信息，这些都可能导致模型给出错误的结果。

5. Pat Grady：借用你先前的表述，第一阶段是企业搜索，第二阶段是应用平台。你怎么看企业搜索和RAG的关系？它们是包含与被包含的关系吗？是相似但不同的概念，还是完全相同的事物？

Arvind Jain：我认为企业搜索和RAG在某种意义上可以说是一体的。它们的核心技术是将所有企业知识整合到一个搜索系统中，让用户提出问题后，系统可以返回相关的信息。这是技术的核心。

你可以将这项技术用作一个独立的产品，比如Glean的搜索产品，它让用户直接提出问题并获取与问题相关的文档；也可以把它作为AI应用的API层，在整个AI应用架构中作为一个组件。因此，它们在这方面是类似的。

不过，目前许多企业中的基于RAG的应用使用的是简化版本的检索系统，通常是基于矢量搜索，并不具备完整的企业内容。我认为这是关键的区别。我们的策略一直是专注于构建一个独立的搜索系统，它足够优秀，可以直接面向用户作为独立产品。这才是真正检验搜索效果的标准。

6. Sonya Huang：是否可以说你们在搜索结果排序方面的技术进步是关键？

Arvind Jain：是的。我认为自己构建这些系统是一项极具挑战的任务，很难在几周内完成。这类系统要稳定、强大，真正能在企业内部带来价值，而不仅仅是一个展示用的AI原型，这是一个难题。现在做一个出色的AI演示只需要一天、甚至两小时就能完成，但要构建真正实用的、可以持续支持企业运作的系统，还是相当困难的。

Glean如何改变人们的工作方式

7. Pat Grady：在你的观察里，客户在日常工作模式中使用Glean前后有什么显著的变化吗？它如何帮助企业更好地完成工作？

Arvind Jain：Glean是一个被广泛使用的产品，我们经常对客户使用Glean的目的感到惊讶。我可以举几个例子：

1). 工程团队：当他们的程序出现错误或故障时，Glean是一个很好的调试工具，因为通常遇到的问题可能其他人已经解决过了。通过Glean，他们可以快速查找到相关内容和解决方案，帮助自己解决问题。

2). 支持团队：支持团队的日常工作是解决人们的问题，Glean能从根本上改变他们的工作方式。他们不再需要手动在不同的知识库中查找答案，而是可以直接通过Glean获取问题的答案。他们的主要工作变成了验证AI给出的答案是否正确，然后再将其分享给客户。

3). 销售团队：他们使用Glean为会议做准备。比如在客户会议前，他们可以快速向Glean提问，获取客户的完整数据，比如上次会议的内容、当前的机会等。这帮助他们高效地准备和应对会议中的问题，提高自信心。在我们公司，销售人员甚至不需要询问技术支持工程师的专业的回答，因为Glean已经能根据以前的解决方案，帮助他们回答客户问题。这就是Glean带来的便利。我们会根据你的问题，帮你找到你想问的相关主题最专业的内容，这也是我们看到企业用户使用非常多的功能。

8. Pat Grady：你们如何判断/衡量这些回答是否有效？是通过用户非常直接的反馈（如点赞），还是通过用户一些间接的行为？

Part.04

Glean不是一家AI公司

9. Pat Grady: 这已经不是你的第一次创业了。Rubrik取得了巨大的成功，你在Google的早期发展中也扮演了重要角色。你认为创立一家专门做AI的公司和只是创立一家公司有多大的区别？

Arvind Jain: 我认为AI只是一种工具。你并不会因为使用了AI就变成一家完全不同的公司。我觉得未来没有任何新公司会完全避开AI技术的应用。我的看法是，创业者需要找到一个想解决的业务问题，然后利用AI技术让解决方案变得更好、更高效。这种做法不会让公司本质发生改变。实际上，我们甚至不认为自己是一家AI公司。

10. Sonya Huang：你们有计划训练自己的模型吗？更宽泛地说，Glean的核心能力边界在哪里？

Arvind Jain：我们并没有计划训练超大规模模型。但与此同时，我们确实会针对较小的模型进行训练。例如，对于每一位客户，我们会为其训练专属的语言模型。这些模型会深入分析客户的企业语料库，理解其中的术语、缩写等内容。

模型训练是Glean核心技术的核心部分，但并不是像训练GPT-4这样的超大规模模型。我们不会涉足这一领域，也没有相关计划。相反，我们会与那些构建这类模型的优秀公司进行合作，将资源集中在我们的核心技术和应用上。