- 博客(8)
- 收藏
- 关注
原创 Deep Research技术调研
摘要:2025年OpenAI和Google相继推出深度研究/搜索功能,标志着信息检索进入新阶段。OpenAI的DeepResearch支持多步推理、联网检索和结构化报告生成;Google则推出可追溯来源的综合报告和代理式操作能力。两大平台通过静态/动态工作流、单/多智能体架构实现复杂任务处理,集成搜索、代码解释器等工具。开源社区也涌现出多种实现方案,但相比商业产品仍存在差距。未来需解决评测基准缺失、信息来源有限等问题,优化内容解析和查询扩展能力,推动深度研究技术的进一步发展。
2025-12-26 10:50:46
702
原创 NL2SQL技术调研
自然语言到SQL(NL2SQL),也被称为文本到SQL,是将自然语言查询转换为可在关系数据库上执行的相应SQL查询的任务。具体来说,给定一个NL和一个DB,NL2SQL的目标是生成一个准确反映用户意图并能在数据库上执行时返回适当结果的SQL。
2025-01-11 15:53:11
2877
原创 HNSW(Hierarchical Navigable Small World)
是Yury A. Malkov提出的一种基于图索引的方法,它是Yury A. Malkov在他本人之前工作NSW上一种改进。通过采用层状结构,将边按特征半径进行分层,使每个顶点在所有层中平均度数变为常数,从而将NSW的计算复杂度由多重对数(Polylogarithmic)复杂度降到了对数(logarithmic)复杂度。HNSW的发展历程是从SW->NSW>HNSW。节点之间通常有较高的连接度,即邻居节点之间往往彼此相连,形成聚集或团簇,任意两个节点之间的平均路径长度较短。
2024-11-24 15:52:45
2378
原创 LSH(Locality-Sensitive Hashing,局部敏感哈希)
在很多应用领域中,我们面对和需要处理的数据往往是海量并且具有很高的维度,怎样快速地从海量的高维数据集合中找到与某个数据最相似(距离最近)的一个数据或多个数据成为了一个难点和问题。如果是低维的小数据集,我们通过线性查找就可以容易解决,但如果是对一个海量的高维数据集采用线性查找匹配的话,会非常耗时,因此,为了解决该问题,我们需要采用一些类似索引的技术来加快查找过程,通常这类技术称为最近邻查找(Nearest Neighbor,AN),例如K-d tree;
2024-11-24 15:41:31
1904
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1