ai
文章平均质量分 73
Dongguabai
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
绕过LLM上下文限制:大规模代码审查的工程实践
方案状态持久化进度追踪跨Session结构化输出代码审查适用性RAG✅❌✅❌⭐⭐Agent记忆✅❌✅❌⭐⭐任务分解❌✅❌✅⭐⭐⭐状态外部化✅✅✅✅⭐⭐⭐⭐⭐这些方案各有优势,但都无法完美解决大规模代码审查的需求。我需要一个专门设计的解决方案。认清本质:LLM跨请求是无状态的,不要期望它在不同Session间"记住"任何东西状态外部化:将任务状态持久化到外部文件,LLM通过读写文件维护状态批次处理:将大任务分解为可管理的批次,每批次独立完成协议驱动。原创 2025-12-27 21:27:32 · 1037 阅读 · 0 评论 -
从“空调故障代码C1”说起:深入理解双编码器和交叉编码器的原理与应用
双编码器是一种将两段文本分别编码为向量,然后通过计算向量相似度来衡量文本关系的模型。它的核心思想是独立编码和向量相似度计算。交叉编码器是一种将两段文本拼接在一起,通过深度交互(如自注意力机制)来捕捉文本间关系的模型。它的核心思想是联合编码和深度语义交互。双编码器:独立编码,速度快,适合大规模数据,但可能忽略细粒度语义。交叉编码器:联合编码,捕捉细粒度语义,适合高精度任务,但计算量大。在实际应用中,我们可以结合两者的优势:先用双编码器快速筛选,再用交叉编码器精确匹配。这样既能提高效率,又能保证准确性。原创 2025-02-24 09:23:57 · 1024 阅读 · 0 评论 -
数据飞轮的含义
数据飞轮通过数据的循环利用,推动业务和技术不断进步,是现代企业提升竞争力的重要工具。原创 2025-02-24 09:15:59 · 1100 阅读 · 0 评论
分享