Cursor在自证自家产品安全申明中一不小心把代码库索引技术细节展露出来了,
https://www.cursor.com/security#certifications
代码库索引技术步骤概况:
-
扫描并计算文件夹中文件的哈希值。
-
构建 Merkle 树并同步到服务器。
-
定期检查并上传更改的文件。
-
在服务器上分块和嵌入文件。
-
存储嵌入并按哈希值索引以加快重复索引速度。
-
推理时,进行最近邻搜索并处理用户提问。
Cursor代码索引流程图来源于:LinearUncle
https://www.cursor.com/security#indexing
流程图来源:https://x.com/LinearUncle/status/1856597751930474873
来源 | PaperAgent