与Copilot创始人的访谈内容总结

最新推荐文章于 2025-07-08 15:32:38 发布

OpenAppAI

最新推荐文章于 2025-07-08 15:32:38 发布

阅读量1.5k

点赞数 38

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/my_name_is_learn/article/details/145480860

在这里插入图片描述

文章目录

Glean公司
Glean 的三部分技术堆栈
RAG 搜索排名系统
企业内部搜索性能指标和未来发展
工作流 Agent 的搭建的重要性
创业的关键是找到要解决的问题

Glean公司

在 9 月份完成了 2.6 亿美元的 E 轮融资后，主打企业内部 AI 搜索的 Glean 估值达到 46 亿美元。
2019 年创立，从企业内部搜索开始做起，5 年内完成五轮融资，在 ChatGPT 推出之后，Glean 以基于 RAG 技术的企业 AI 搜索为核心，陆续推出 Glean Assistant（Copilot）、Glean Apps（应用平台）和 Glean Actions（Agent）等产品。过去一年，Glean 的 ARR 几乎翻了 4 倍，达到 5500 万美元。

值得注意的是，它的 DAU/MAU 比例约为 40%，远高于传统企业 SaaS 的 10-20%。核心产品 Glean Assistant 的用户每天平均查询 14 次，而谷歌的用户日均查询次数为 3-4 次。Databricks、Duolingo、Grammarly 和 Sony Electronics 都是它的客户。

可以说，Glean 把企业内部 AI 搜索这事儿做成了。

最近，红杉资本和 Glean 创始人 Arvind Jain 进行了深度访谈，Arvind Jain 是 Google 早期员工，Google 搜索算法的核心构建者。在这次访谈中，他们探讨了为什么企业搜索比互联网搜索更难，如何突破这个难点；AI 如何在企业内部落地，以及如何用 RAG 实现和 Google 搜索类似的搜索排名效果；这为 ToB 方面的 AI 落地实践提供了参考。

下面是二次整理的访谈内容和我的理解，原文链接：Glean：企业AI搜索，估值46亿美元，ARR一年翻4倍

Glean 的三部分技术堆栈

1：Glean 的业务及其目标？

Glean 是公司内部的 Google 或 ChatGPT。公司员工可以向它提问，Glean 会使用公司的内部知识，回答所有的问题。此外，企业可以使用 Glean 的 RAG 平台快速构建 AI 应用程序。

2：做企业内部AI搜索为什么那么难？

难度主要在于获取信息，企业内部的信息分散在众多不同的系统中，更难的是理解哪些信息是有用的、哪些已经过时。要让企业信息变得可以被搜索，需要将数据引入搜索系统，需要连接企业的所有数据，这可能花费一年时间与企业合作

3：在企业内部AI搜索中，Glean 的三部分技术堆栈分别是什么？

第一部分是与最常见的企业系统建立的深入集成，比如 Salesforce、Confluence、Jira、Google Drive、SharePoint、ServiceNow 等，企业数据通常存储在这些系统中，我们要将它们全部汇集到一个地方。

第二部分是治理层，这一层负责理解跨越上百个不同系统的权限规则。需要考虑企业数据，这也是企业搜索和 Google 搜索之间最主要的区别之一。大多数企业信息是私有的，当用户在 Google Drive 创建了一份文档，这个文档可能仅对用户个人可见，或者与少数其他人共享。因此，很难构建一个将公司所有知识一股脑地开放给所有人的搜索引擎，这个系统必须理解每个内容的权限。当用户进行搜索时，系统需要理解用户身份，并只返回他们有权限访问的信息。

第三部分是构建了一个深度知识图谱。理解员工、知识以及它们之间的关系是企业内部搜索或问答服务成功的关键。这正是我们所做的，我们构建了一个深度知识图谱，分析所有员工，理解他们在公司中扮演的角色；分析所有文档，并试图理解哪些文档适用于哪些部门，哪些文档被广泛使用。我们还分析某个员工与某个文档之间的关系，这些信息构成了我们系统的核心基础，当有人提问时，能够根据他们的需求优先返回最相关的知识。