
大模型
文章平均质量分 85
风生水气
当前focus大模型应用,感兴趣可以一起探讨
展开
-
0.0973585?探究ts_rank的score为什么这么低
在postgreSQL中使用ts_rank计算相似度时,得分会非常低。为什么分数这么低?这么低的分数是不是对的?ts_rank时得计算逻辑是怎样的?带着这个疑问,我们深入探究一下。原创 2025-05-04 15:18:05 · 1081 阅读 · 0 评论 -
项目剖析:基于Agent的个人知识管理系统如何设计
本文档主要从整体架构、dataflow的视角剖析khoj项目,分析应该一个知识管理Agent系统的架构是怎样的。如果你也在做类似的事,希望能有一定的启发作用。原创 2025-04-30 17:29:11 · 830 阅读 · 0 评论 -
MCP是什么?带你清晰明了的看懂MCP
读完本文你会了解到:什么是MCP,为什么需要MCP? 基于MCP的应用架构是怎样的?具体的工作原理?一些已有的MCP资源?原创 2025-04-15 16:58:11 · 1448 阅读 · 0 评论 -
基于LangGraph的智能报告生成平台项目分析
不知道你是否知道或者了解OpenAI and Gemini Deep Research。他们是一种能够根据输入问题进行规划、结合网络搜索获取信息并最终呈现结果的研究工具或技术。那这样research是如何实现的呢?最近刚好看到一个实现类似功能的开源项目: open_deep_search。本文将基于该项目进行代码层面剖析。原创 2025-04-14 18:43:48 · 748 阅读 · 0 评论 -
LangGraph基础:带你系统性了解LangGraph中的必备知识
LangGraph 是 LangChain 生态系统中的一个重要工具,通过基于图的建模方式和强大的状态管理机制,为开发者提供了构建复杂智能体应用的能力。本文主要系统性的介绍一些LangChain中一些必知必会的基础知识,方便我们后续做项目开发。原创 2025-04-14 18:32:19 · 1048 阅读 · 0 评论 -
Mooncake:kimi后端推理服务的架构设计
本文依托论文《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》来讲解kimi的后端服务架构Mooncake,并按照自己的思路来梳理论文中的一些关键信息。原创 2024-12-28 19:00:00 · 2037 阅读 · 0 评论 -
RAG新动向:CORAL,多轮对话RAG的benchmark
本文是对《CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation》学习、理解和重新整理,希望帮助感兴趣的同学更容易掌握这一块的内容。原创 2024-12-27 18:15:00 · 1563 阅读 · 0 评论 -
大模型应用技术系列(四): 为RAG应用设计的缓存RAGCache
本文将介绍一个最新的Cache:RAGCache,它是针对RAG应用的特点设计了一套分层的缓存系统,通过它可以提升应用的吞吐量,加速了应用的处理。原创 2024-12-26 17:27:56 · 1445 阅读 · 0 评论 -
大模型应用技术系列(二):大模型部署和推理优化
本文将从部署演进的视角,阐述了大模型部署方式以及其中设计到的推理优化过程。原创 2024-12-24 16:59:39 · 1461 阅读 · 0 评论 -
大模型应用技术系列(一):大模型应用整体技术栈浅析
技术最终是为业务服务的,基于新兴的大模型技术,最近涌现出各种有意思的应用。从我的视角,这部分应用通常可以被分为两类:问答式应用和生成式应用。典型的问答式应用包括:chat应用、智能助手、企业知识库等;典型的生成式应用包括:文本创作、文生图、文生视频等。那么,这些应用是如何构建的呢?如何基于大模型来构建起这样的一个私人/企业级的应用呢?本文接下来的部分将探索构建这样应用的流程和所涉及到的技术栈。原创 2024-12-23 17:25:34 · 1082 阅读 · 0 评论 -
Lovable: 使用自然语言构建web app
之前的文章中我们已经介绍和探索了两款使用自然语言构建应用程序的工具,今天,我们介绍另一款相关的工具:Lovable。原创 2024-12-06 18:38:21 · 1026 阅读 · 0 评论 -
bot.new: 另一个自然语言编程的低代码平台
上一篇文章中,介绍了v0.dev这样一个利用自然语言进行编程的低代码平台。那除了它之外,还有没有其他类似的工具呢?这篇文章会介绍另一个类似功能的平台:bot.new原创 2024-12-03 13:21:23 · 576 阅读 · 0 评论 -
V0.dev:更符合用户习惯的低代码平台
在之前的文章《关于大模型应用到低代码平台的一些想法》中,曾经描述过我对于低代码平台的设计构想,最近,我发现一些实现这种想法的工具。在这里做一下分享。本文主要介绍V0.dev工具,后续也会继续介绍其他工具。原创 2024-12-02 17:11:54 · 1303 阅读 · 0 评论 -
windows部署基于Composio的skekit应用问题解决记录
本文以部署实现SWE demo为目标,定位了遇到的超时问题,并通过修改源码重新部署的方式进行了解决。希望能对此项目感兴趣但部署时遇到此问题的同学提供帮助。原创 2024-11-28 13:47:29 · 1040 阅读 · 0 评论 -
构建大模型应用的技术栈浅析
(包含详细说明)暂时放在掘金,后续考虑搬过来。转载 2024-11-19 21:41:27 · 79 阅读 · 0 评论 -
RAG 完结篇
关于RAG的学习,准备到这里暂时告一段落。在当前的学习过程中发现实际落地还是要依托于更加确定的业务场景和业务数据,但目前来说并没有遇到很合适的继续发展下去的场景。因此,准备暂时搁置RAG,继续探索其他方向。本文是对这段时间学习依赖的一些总结和思考。原创 2024-11-05 14:55:21 · 1286 阅读 · 0 评论 -
记录一次使用AI代码辅助工具解决开源代码问题的过程
记录一次使用ai代码辅助工具解决开源代码中问题的过程~原创 2024-09-09 16:10:28 · 689 阅读 · 2 评论 -
RAG能否进一步抽象成Agent?关于RAG系统构建的一些想法
最近在不断地学习RAG相关的知识,这个学习过程中对于RAG的认知也在不断地改变。这篇文章主要记录一些当前最新的想法。原创 2024-08-26 17:23:35 · 352 阅读 · 0 评论 -
检索结果重新排序?RRF(Reciprocal Rank Fusion)介绍
在之前探索的RAG系统中,为了提升检索质量,我们通常会引入不同的检索方法进行不同的相关性检索,并最终整合所有的检索结果进行最终的排序。在这个过程中涉及到一个概念:RRF。那它是什么意思呢?它是怎样进行计算的呢?本文将帮助你理解这个概念。原创 2024-08-20 13:00:21 · 1182 阅读 · 0 评论 -
大模型技术学习系列(5): 基于langchain构建RAG应用
本章中,我们回归了一下RAG的流程,并分析了下这个过程中涉及到的组件以及这些组件在langchain中对应的实现方式,并整合这些方式,实现了带RAG的大模型应用。通过这个实践过程,能够帮助我们更好的理解RAG的整个过程。原创 2024-07-23 16:39:35 · 1493 阅读 · 0 评论 -
langchain下如何加载embeding模型
本文主要介绍基于langchain构建RAG应用时,如何下载embeding模型供应用使用原创 2024-07-23 16:23:23 · 1998 阅读 · 0 评论 -
大模型技术学习系列(4): langchain+ollama构建本地大模型应用
本章主要阐述了本地构建基于大模型的应用程序的过程。从资源准备分析到实际搭建,一步步的指导应该如何在本地搭建一个基于大模型的应用程序。原创 2024-07-20 15:37:45 · 1622 阅读 · 0 评论 -
大模型技术学习(3): RAG
本章内容中我们从大模型的问题出发,谈到解决问题的两种方式:微调和RAG。之后我们详细讲解了RAG的基本概念和组成范式。最后我们对比了一下RAG和微调两种大模型优化方式的优缺点、使用场景,并且介绍了下RAG技术当前的最新进展。原创 2024-07-18 18:17:25 · 937 阅读 · 0 评论 -
大模型技术学习系列(1):从大模型开始
本文作为大模型技术学习的第一章内容,从基本概念开始,介绍了什么是大模型,大模型有什么特点,大模型的一般架构,并从多个视角对大模型进行分类,帮助我们建立了大模型的基本认知,梳理了大模型的功能特点和应用场景。最后,阐述了大模型存在的问题,以及可行的一些解决思路。原创 2024-07-13 17:27:14 · 1227 阅读 · 0 评论 -
大模型技术学习系列(2): 模型幻觉
本文主要介绍了大模型中普遍存在且至关重要的一个问题:模型幻觉。从模型幻觉是什么,到模型幻觉如何产生,再到模型幻觉如何缓解。较为详细的介绍了模型幻觉相关的内容。原创 2024-07-16 19:34:49 · 1182 阅读 · 0 评论