与Copilot创始人的访谈内容总结

在这里插入图片描述

Glean公司

在 9 月份完成了 2.6 亿美元的 E 轮融资后,主打企业内部 AI 搜索的 Glean 估值达到 46 亿美元。
2019 年创立,从企业内部搜索开始做起,5 年内完成五轮融资,在 ChatGPT 推出之后,Glean 以基于 RAG 技术的企业 AI 搜索为核心,陆续推出 Glean Assistant(Copilot)、Glean Apps(应用平台)和 Glean Actions(Agent)等产品。过去一年,Glean 的 ARR 几乎翻了 4 倍,达到 5500 万美元。

值得注意的是,它的 DAU/MAU 比例约为 40%,远高于传统企业 SaaS 的 10-20%。核心产品 Glean Assistant 的用户每天平均查询 14 次,而谷歌的用户日均查询次数为 3-4 次。Databricks、Duolingo、Grammarly 和 Sony Electronics 都是它的客户。

可以说,Glean 把企业内部 AI 搜索这事儿做成了。

最近,红杉资本和 Glean 创始人 Arvind Jain 进行了深度访谈,Arvind Jain 是 Google 早期员工,Google 搜索算法的核心构建者。在这次访谈中,他们探讨了为什么企业搜索比互联网搜索更难,如何突破这个难点;AI 如何在企业内部落地,以及如何用 RAG 实现和 Google 搜索类似的搜索排名效果;这为 ToB 方面的 AI 落地实践提供了参考。

下面是二次整理的访谈内容和我的理解,原文链接:Glean:企业AI搜索,估值46亿美元,ARR一年翻4倍

Glean 的三部分技术堆栈

1:Glean 的业务及其目标?

Glean 是公司内部的 Google 或 ChatGPT。公司员工可以向它提问,Glean 会使用公司的内部知识,回答所有的问题。此外,企业可以使用 Glean 的 RAG 平台快速构建 AI 应用程序。

2:做企业内部AI搜索为什么那么难?

难度主要在于获取信息,企业内部的信息分散在众多不同的系统中,更难的是理解哪些信息是有用的、哪些已经过时。要让企业信息变得可以被搜索,需要将数据引入搜索系统,需要连接企业的所有数据,这可能花费一年时间与企业合作

3:在企业内部AI搜索中,Glean 的三部分技术堆栈分别是什么?

第一部分是与最常见的企业系统建立的深入集成,比如 Salesforce、Confluence、Jira、Google Drive、SharePoint、ServiceNow 等,企业数据通常存储在这些系统中,我们要将它们全部汇集到一个地方。

第二部分是治理层,这一层负责理解跨越上百个不同系统的权限规则。需要考虑企业数据,这也是企业搜索和 Google 搜索之间最主要的区别之一。大多数企业信息是私有的,当用户在 Google Drive 创建了一份文档,这个文档可能仅对用户个人可见,或者与少数其他人共享。因此,很难构建一个将公司所有知识一股脑地开放给所有人的搜索引擎,这个系统必须理解每个内容的权限。当用户进行搜索时,系统需要理解用户身份,并只返回他们有权限访问的信息。

第三部分是构建了一个深度知识图谱。理解员工、知识以及它们之间的关系是企业内部搜索或问答服务成功的关键。这正是我们所做的,我们构建了一个深度知识图谱,分析所有员工,理解他们在公司中扮演的角色;分析所有文档,并试图理解哪些文档适用于哪些部门,哪些文档被广泛使用。我们还分析某个员工与某个文档之间的关系,这些信息构成了我们系统的核心基础,当有人提问时,能够根据他们的需求优先返回最相关的知识。

RAG 搜索排名系统

4:在企业内部AI搜索中,如何打造优秀的排名系统?

为了构建优秀的搜索排名系统,我们做了大量的工作。我们有一些用来判断哪些文档最适合在某个问题下排名靠前的因素。比如࿰

内容概要:本书《Deep Reinforcement Learning with Guaranteed Performance》探讨了基于李雅普诺夫方法的深度强化学习及其在非线性系统最优控制中的应用。书中提出了一种近似最优自适应控制方法,结合泰勒展开、神经网络、估计器设计及滑模控制思想,解决了不同场景下的跟踪控制问题。该方法不仅保证了性能指标的渐近收敛,还确保了跟踪误差的渐近收敛至零。此外,书中还涉及了执行器饱和、冗余解析等问题,并提出了新的冗余解析方法,验证了所提方法的有效性和优越性。 适合人群:研究生及以上学历的研究人员,特别是从事自适应/最优控制、机器人学和动态神经网络领域的学术界和工业界研究人员。 使用场景及目标:①研究非线性系统的最优控制问题,特别是在存在输入约束和系统动力学的情况下;②解决带有参数不确定性的线性和非线性系统的跟踪控制问题;③探索基于李雅普诺夫方法的深度强化学习在非线性系统控制中的应用;④设计和验证针对冗余机械臂的新型冗余解析方法。 其他说明:本书分为七章,每章内容相对独立,便于读者理解。书中不仅提供了理论分析,还通过实际应用(如欠驱动船舶、冗余机械臂)验证了所提方法的有效性。此外,作者鼓励读者通过仿真和实验进一步验证书中提出的理论和技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值