与Copilot创始人的访谈内容总结

在这里插入图片描述

Glean公司

在 9 月份完成了 2.6 亿美元的 E 轮融资后,主打企业内部 AI 搜索的 Glean 估值达到 46 亿美元。
2019 年创立,从企业内部搜索开始做起,5 年内完成五轮融资,在 ChatGPT 推出之后,Glean 以基于 RAG 技术的企业 AI 搜索为核心,陆续推出 Glean Assistant(Copilot)、Glean Apps(应用平台)和 Glean Actions(Agent)等产品。过去一年,Glean 的 ARR 几乎翻了 4 倍,达到 5500 万美元。

值得注意的是,它的 DAU/MAU 比例约为 40%,远高于传统企业 SaaS 的 10-20%。核心产品 Glean Assistant 的用户每天平均查询 14 次,而谷歌的用户日均查询次数为 3-4 次。Databricks、Duolingo、Grammarly 和 Sony Electronics 都是它的客户。

可以说,Glean 把企业内部 AI 搜索这事儿做成了。

最近,红杉资本和 Glean 创始人 Arvind Jain 进行了深度访谈,Arvind Jain 是 Google 早期员工,Google 搜索算法的核心构建者。在这次访谈中,他们探讨了为什么企业搜索比互联网搜索更难,如何突破这个难点;AI 如何在企业内部落地,以及如何用 RAG 实现和 Google 搜索类似的搜索排名效果;这为 ToB 方面的 AI 落地实践提供了参考。

下面是二次整理的访谈内容和我的理解,原文链接:Glean:企业AI搜索,估值46亿美元,ARR一年翻4倍

Glean 的三部分技术堆栈

1:Glean 的业务及其目标?

Glean 是公司内部的 Google 或 ChatGPT。公司员工可以向它提问,Glean 会使用公司的内部知识,回答所有的问题。此外,企业可以使用 Glean 的 RAG 平台快速构建 AI 应用程序。

2:做企业内部AI搜索为什么那么难?

难度主要在于获取信息,企业内部的信息分散在众多不同的系统中,更难的是理解哪些信息是有用的、哪些已经过时。要让企业信息变得可以被搜索,需要将数据引入搜索系统,需要连接企业的所有数据,这可能花费一年时间与企业合作

3:在企业内部AI搜索中,Glean 的三部分技术堆栈分别是什么?

第一部分是与最常见的企业系统建立的深入集成,比如 Salesforce、Confluence、Jira、Google Drive、SharePoint、ServiceNow 等,企业数据通常存储在这些系统中,我们要将它们全部汇集到一个地方。

第二部分是治理层,这一层负责理解跨越上百个不同系统的权限规则。需要考虑企业数据,这也是企业搜索和 Google 搜索之间最主要的区别之一。大多数企业信息是私有的,当用户在 Google Drive 创建了一份文档,这个文档可能仅对用户个人可见,或者与少数其他人共享。因此,很难构建一个将公司所有知识一股脑地开放给所有人的搜索引擎,这个系统必须理解每个内容的权限。当用户进行搜索时,系统需要理解用户身份,并只返回他们有权限访问的信息。

第三部分是构建了一个深度知识图谱。理解员工、知识以及它们之间的关系是企业内部搜索或问答服务成功的关键。这正是我们所做的,我们构建了一个深度知识图谱,分析所有员工,理解他们在公司中扮演的角色;分析所有文档,并试图理解哪些文档适用于哪些部门,哪些文档被广泛使用。我们还分析某个员工与某个文档之间的关系,这些信息构成了我们系统的核心基础,当有人提问时,能够根据他们的需求优先返回最相关的知识。

RAG 搜索排名系统

4:在企业内部AI搜索中,如何打造优秀的排名系统?

为了构建优秀的搜索排名系统,我们做了大量的工作。我们有一些用来判断哪些文档最适合在某个问题下排名靠前的因素。比如,如果公司内部有一份文档被频繁查看,这显然表明该文档有重要信息,人们愿意花时间阅读它。如果一份文档是在过去一两周内写的,并且有一些互动,这也表明它是人们关心的信息。再比如,如果一

消息 优快云首页 发布文章 【数据驱动】【航空航天结构的高效损伤检测技术】一种数据驱动的结构健康监测(SHM)方法,用于进行原位评估结构健康状态,即损伤位置和程度,在其中利用了选定位置的引导式兰姆波响应(Matlab代码实现) 99 100 摘要:会在推荐、列表等场景外露,帮助读者快速了解内容,支持一键将正文前 256 字符键入摘要文本框 0 256 AI提取摘要 您已同意GitCode 用户协议 和 隐私政策,我们会为您自动创建账号并备份文章至我的项目。 活动 话题 共 0 字 意见反馈内容概要:本文研究了在湍流天气条件下,无人机发生发动机故障时的自动着陆问题,提出了一种多级适配控制策略,并通过Matlab进行仿真代码实现。该策略旨在提升无人机在极端环境下的安全着陆能力,重点解决了气流干扰动力失效双重挑战下的姿态稳定轨迹规划问题。研究涵盖了故障检测、控制系统重构、自适应调整及安全着陆路径生成等关键技术环节,验证了所提方法在复杂气象条件下的有效性鲁棒性。; 适合人群:具备一定无人机控制、自动控制理论基础及Matlab编程能力的科研人员、研究生以及从事航空航天、智能控制领域的工程技术人员。; 使用场景及目标:①用于无人机故障应急控制系统的设计仿真;②支持复杂环境下无人机动态响应分析控制算法开发;③为飞行器自主安全着陆技术提供解决方案参考。; 阅读建议:建议结合Matlab代码控制理论深入理解多级适配机制,重点关注故障识别控制切换逻辑,可通过修改仿真参数测试不同湍流强度下的系统表现,以加深对算法鲁棒性的认识。
GitHub Copilot 是一个基于人工智能的代码辅助工具,能够通过提供代码建议来提升开发效率。在 PyCharm 中集成 GitHub Copilot,需要通过安装插件并进行相关配置。 首先,确保 PyCharm 的版本支持插件安装。GitHub Copilot 提供了适用于 JetBrains 系列 IDE 的插件,包括 PyCharm。可以通过以下步骤完成安装: 1. 打开 PyCharm,进入 `Settings`(设置)界面。 2. 导航至 `Plugins`(插件)部分。 3. 在搜索栏中输入 "GitHub Copilot",找到官方提供的插件。 4. 点击 `Install`(安装)按钮进行插件安装。安装完成后,重启 PyCharm 以使插件生效[^1]。 安装完成后,需要登录 GitHub 账户以启用 GitHub Copilot 的功能。具体步骤如下: 1. 在 PyCharm 中打开任意代码文件。 2. 按下 `Ctrl + Enter`(Windows/Linux)或 `Cmd + Enter`(Mac)打开 GitHub Copilot 快捷菜单。 3. 选择 `Sign in to GitHub`(登录到 GitHub)选项,按照提示完成身份验证。 4. 登录成功后,GitHub Copilot 将自动开始提供代码建议[^1]。 为了更好地适应个人编码风格,还可以对 GitHub Copilot 进行一些个性化配置: - **调整建议设置**:可以在 `Settings` -> `GitHub Copilot` 中调整建议的触发方式、显示样式等。 - **启用或禁用特定文件类型**:如果希望在某些文件类型中禁用 GitHub Copilot,可以在设置中进行相应调整。 - **管理建议范围**:可以选择是否允许 GitHub Copilot 提供多行建议或仅单行建议[^1]。 GitHub Copilot 在 PyCharm 中的集成不仅限于基本的代码补全功能,还可以其他功能如代码片段、单元测试等紧密结合,进一步提升开发效率。 ```python # 示例:使用 GitHub Copilot 编写一个简单的函数 def calculate_sum(a, b): # GitHub Copilot 可能会建议以下代码 return a + b ``` 通过上述步骤,可以顺利在 PyCharm 中集成并配置 GitHub Copilot,从而享受其带来的高效编码体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值