- 博客(75)
- 资源 (14)
- 收藏
- 关注
原创 程序员应该熟悉的概念(9)向量相似度(vector similarity)
由于这些向量相当于将文本做了分类:**语义相近的距离越近**,所以这些向量就可以很方便的应用于**语义检索**场景了。
2025-12-15 09:23:18
852
原创 程序员应该熟悉的概念(8)嵌入和语义检索
**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具,旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口,使用不同大模型。
2025-12-14 13:18:47
1100
原创 程序员应该熟悉的概念(7)vLLM和ollama
**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具,旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口,使用不同大模型。
2025-12-14 13:09:00
272
原创 程序员应该熟悉的概念(6)Fine-tuning和RAG
**大语言模型/LLM** 通常是由海量通用知识(如语法、常识、逻辑)训练的,在面对具体场景(如医疗问诊、法律文书生成)时,能力往往不足。 **Fine-tuning/微调** 正是为解决这一问题而生的核心技术,其本质是在预训练模型的基础上,用特定领域 / 任务的小数据集进一步训练,让模型 **适配具体需求**,最终输出更精准、更贴合场景的结果。
2025-12-12 11:46:50
987
原创 程序员应该熟悉的概念(5)MoE
**MoE**(Mixture of Experts,专家混合模型))是当前大模型(尤其是 GPT-4、Gemini、Mixtral、DeepSeek 等)架构中非常核心的一个概念。 **MoE** 的思想非常直白:不同的 `专家/Expert` 只负责处理自己擅长的那一类输入,而不是让整个模型的所有参数都去处理所有任务。
2025-12-12 11:43:17
898
原创 本地大模型编程实战(39)MCP实战演练
本文将使用`Visual Studio Code`写一个`MCP服务端`和`MCP客户端`,演示**MCP**的基本功能。
2025-12-11 11:56:42
1220
原创 程序员应该熟悉的概念(3)MCP简介
**MCP**(Model Context Protocol) 是由 Anthropic 在 2024 年 11 月提出并开源的一个协议标准,目的是统一 AI 模型(尤其是大语言模型) 与外部资源 / 工具 / 数据源之间的交互方式。
2025-12-10 09:14:08
802
原创 本地大模型编程实战(38)实现一个通用的大模型客户端
由于大部分AI平台提供的API/接口都兼容 `OpenAI API` ,所以我们可以使用 `OpenAI SDK` 实现通用的 `LLM(大语言模型)` 客户端。
2025-12-10 09:07:39
1083
原创 程序员应该熟悉的概念(2)OpenAI API
大名鼎鼎的 **OpenAI** 发布之后,其 **OpenAI API规范** 逐渐成了事实上的工业标准,很多大模型API都兼容这个规范。这也就意味着:OpenAI的SDK可以使用很多大模型。
2025-12-09 12:22:34
423
原创 程序员应该熟悉的概念(1)RESTful
在这个前后端分离(前端和后端均为独立的应用,只通过API/接口通信)成为应用编程主流的时代,**RESTful** 规范(REST全称是:Representational State Transfer)应该是程序员**必须掌握**的API/接口设计规范。
2025-12-09 11:27:48
370
原创 本地大模型编程实战(37)使用知识图谱增强RAG(3)
本文将简单介绍如何使用 提升 **RAG(Retrieval Augmented Generation,检索增强生成)** 的问答效果。
2025-09-18 21:42:53
1156
原创 本地大模型编程实战(36)使用知识图谱增强RAG(2)生成知识图谱
本文将简单介绍如何把文本生成 **知识图谱**(Knowledge Graph)。具体来说,是使用开源项目 [AutoSchemaKG](https://github.com/HKUST-KnowComp/AutoSchemaKG) 生成 **GraphML** 。 **GraphML** 是 XML(Extensible Markup Language) 格式的文件,可以使用 **NetworkX** 等框架轻松处理这种格式的文件。
2025-09-18 21:40:02
899
原创 本地大模型编程实战(35)使用知识图谱增强RAG(1)知识图谱简介
知识图谱的主要特点是建立了“知识”之间的关联,所以它的强项是 **推理** ,**HugeGraph** 、**NetworkX** 支持 **PageRank**(在后面RAG中会用到)、k-短路、LPA(标签传播算法)、Jaccard 相似度 等算法。有了这些支持,它在 搜索引擎 、智能问答**RAG**(Retrieval Augmented Generation,检索增强生成) 等领域都有广泛的应用,可以明显提升这些领域应用的智能化水平。
2025-09-17 17:26:24
851
原创 本地大模型编程实战(34)使用faiss实现语义检索
**FAISS**(Facebook AI Similarity Search)是 Facebook AI 研究院开发的一款高效的向量相似性搜索库,专门用于优化大规模高维向量的近邻搜索任务,广泛应用于语义检索、图像检索、推荐系统等场景。 本文将详细介绍如何使用 **FAISS** 实现语义检索。具体内容包括: - 将内容矢量化并保存为索引 - 在保存索引的同时,保存每条信息的相关信息metadata - 通过矢量库进行语义检索
2025-09-17 17:23:46
1582
原创 使用NetworkX查询GraphML图数据
本文使用 **Nextworkx** 实现查询 **GraphML** 图数据的功能。 - 查询根节点,支持分页 - 查询某个节点的子图结构:即它的子节点以及子节点对应的边和下一级节点
2025-09-16 14:51:42
538
原创 使用pyHugeGraph查询HugeGraph图数据
在实际项目中,我们经常会遇到类似下面的查询图数据库的需求: 1. 查询根节点,根节点可能有多个,需要**分页** 2. 点击根节点,查询其子节点以及子节点关联的边和更下一层的子节点 本文使用 **pyHugeGraph** 实现上述查询 **HugeGraph** 图数据库的功能。
2025-09-15 09:28:51
1040
原创 本地大模型编程实战(33)用SSE实现大模型的流式输出
我们使用大语言模型**qwen3**实现翻译功能。它可以自动识别源语言,就可以翻译为目标语种。 > 像千问这种大模型是基于多语言训练的,所以它支持中文、英文、法文、西班牙等多个语种的翻译。
2025-09-15 09:09:14
1190
原创 在windows系统中安装图数据库NEO4J
>`Neo4j`是一个高性能的`NOSQL`图形数据库,它将结构化数据存储在网络上而不是表中。 >`Neo4j`也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。本文讲述了在如何在`windows`系统中安装`NEO4J`。
2025-05-09 14:20:54
723
原创 本地大模型编程实战(32)用websocket显示大模型的流式输出
本文将模仿后端流式输出文字,前端一块一块的显示文字。主要的实现路径是:- `LLM` 采用 `qwen3` ,使用 `stream` 方式输出 - 后端使用 `langchain` 框架- 使用 `fastapi` 实现后端接口 - 前后端之间使用 **`websocket`** 长连接通信- 前端使用一个简单的 `html5` 网页做演示
2025-05-02 17:45:48
1748
原创 本地大模型编程实战(31)用Map-Reduce从大文本中提取摘要
在执行从文本中提取摘要的任务时,难免遇到大文本的情况:文本的长度超出了 `LLM(大语言模型)` 的token限制。 `LangGraph` 提供了 `map-reduce` 工作流,它先把大文本拆成小文档分别提取摘要,然后再提炼/压缩提取的摘要,直到最后提取的摘要的token长度满足既定要求。
2025-05-01 10:19:01
855
原创 本地大模型编程实战(29)查询图数据库NEO4J(2)
上一篇文章 [用大语言模型LLM查询图数据库NEO4J(1)]介绍了使用`GraphQACypherChain`查询`NEO4J`。用它实现简单快捷,但是不容易定制,在生产环境中可能会面临挑战。本文将基于`langgraph` 框架,用`LLM(大语言模型)`查询图数据库`NEO4J`。它可以定义清晰复杂的工作流,能应对比较复杂的应用场景。
2025-04-29 16:22:58
1300
原创 本地大模型编程实战(28)查询图数据库NEO4J(1)
本文将基于`langchain` 框架,用`LLM(大语言模型)`查询图数据库`NEO4J`。
2025-04-29 16:05:47
825
原创 本地大模型编程实战(27)初探langgraph的流式输出
对于 `LLM(大语言模型)`,流式传输已成为一种越来越受欢迎的功能。其理念是在 `LLM` 生成令牌时就快速返回,而不是等待创建完整响应后再返回全部内容。对于简单的场景,流式传输实际上非常容易实现,但当涉及到智能体之类的应用时,它会变得复杂,这些智能体有自己的运行逻辑,可能会阻止我们尝试进行流式传输。本文将探讨 `langchain` 的流式输出,后面将实现**智能体最终结果的流式输出**。
2025-02-28 16:38:20
1999
原创 本地大模型编程实战(26)用langgraph实现基于SQL数据构建的问答系统(5)
本文将将扩展上一篇文章完成的 `langgraph` 链,继续使用基于 `langgraph` 链 ,对结构化数据库 `SQlite` 进行查询的方法。该系统建立以后,我们不需要掌握专业的 `SQL` 技能,可以用自然语言询问有关数据库中数据的问题并返回答案。主要完善一下两点内容: - 自动记录消息历史- 增加人工审核环节,防止 `LLM(大语言模型)` 运行危险的SQL语句
2025-02-28 16:32:10
1087
原创 本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)
本文将演练使用基于 `langgraph` 链 ,对结构化数据库 `SQlite` 进行查询的方法。该系统建立以后,我们不需要掌握专业的 `SQL` 技能,可以用自然语言询问有关数据库中数据的问题并返回答案。 使 `大语言模型(LLM)` 查询结构化数据与非结构化文本数据有所不同。查询非结构化数据时,通常需要将待查询的文本嵌入到向量数据库中;而查询结构化数据的方法则是让 `LLM` 编写和执行 `DSL`(例如 SQL)进行查询。
2025-02-26 09:23:02
1323
原创 本地大模型编程实战(24)用智能体(Agent)实现智能纠错的SQL数据库问答系统(3)
本文将实现这样一个 `智能体(Agent)` :- 可以使用自然语言对 `SQLite` 数据库进行查询。即:用户用自然语言提出问题,智能体也用自然语言根据数据库的查询结果回答问题。- 增加一个自动对查询中的专有名词进行纠错的工具,这将明显提升查询的准确性。
2025-02-26 09:19:21
1374
原创 本地大模型编程实战(23)用智能体(Agent)实现基于SQL数据构建问答系统(2)
本文将用 `智能体(Agent)` 实现对 `SQLite` 数据库的查询:用户用自然语言提出问题,智能体也用自然语言根据数据库的查询结果回答问题。
2025-02-25 14:39:02
1474
原创 本地大模型编程实战(22)用langchain实现基于SQL数据构建问答系统(1)
使 `LLM(大语言模型)` 系统能够查询结构化数据与非结构化文本数据在性质上可能不同。后者通常生成可在向量数据库中搜索的文本,而结构化数据的方法通常是让 `LLM` 编写和执行 `DSL`(例如 SQL)中的查询。 我们将演练在使用基于 `langchain` 链 ,在结构化数据库 `SQlite` 中的数据上创建问答系统的基本方法,该系统建立以后,我们用自然语言询问有关数据库中数据的问题并返回自然语言答案。
2025-02-25 14:36:48
1536
原创 本地大模型编程实战(21)支持多参数检索的RAG(Retrieval Augmented Generation,检索增强生成)(5)
在实现 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统的时候,在检索(retrieve)知识库时通常一个参数。 本文将演练更复杂一点的情况:通过两个参数进行知识库的检索。为此会在 `langgraph`链 中增加一个 `analyze_query` 节点,它用来基于用户问题推理检索的参数。
2025-02-24 11:23:12
1012
原创 本地大模型编程实战(20)用langgraph和智能体实现RAG(Retrieval Augmented Generation,检索增强生成)(4)
上一篇文章我们演练了一个 [用 `langgraph` 实现的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统]。本文将要在此基础上,增加自动记录聊天历史的功能,另外,我们还将使用一个 `Agent(智能体)` 来实现几乎同样的功能,我们来一起体会一下用 `langgraph` 和 `Agent(智能体)` 实现 `RAG系统` 的区别。
2025-02-24 11:18:48
2321
2
原创 本地大模型编程实战(19)RAG(Retrieval Augmented Generation,检索增强生成)(3)
上一篇文章我们演练了一个 [用 `langgraph` 实现的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统](http://wfcoding.com/articles/practice/0318/)。本文将要创建的系统将更加智能:如果在知识库中未找到靠谱的文档,则用 `LLM(大语言模型)` 自身的能力弥补。
2025-02-16 20:59:00
1461
原创 本地大模型编程实战(18)RAG(Retrieval Augmented Generation,检索增强生成)(2)
本文将使用 `langgraph` 实现一个简单的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统。> 使用 `qwen2.5` 、 `deepseek-r1` 以及 `llama3.1` 做实验,用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。
2025-02-16 16:31:20
1083
原创 本地大模型编程实战(17)RAG(Retrieval Augmented Generation,检索增强生成)(1)
本文将用实际代码演练一个简单的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统。> 我们将使用 `qwen2.5` 、 `deepseek-r1` 以及 `llama3.1` 做实验,用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。
2025-02-16 11:56:11
1264
原创 本地大模型编程实战(16)初探智能体Agent(3)
本文将基于上一篇文章完善 `Agent(智能体)` ,主要完善的功能有: - 跟踪 `Agent(智能体)` 的执行过程- 记录消息历史> 此次我们使用 `qwen2.5` 做 `LLM(大语言模型)` 驱动 `Agent(智能体)` ,使用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。<!--more-->## 准备在正式开始撸代码之前,需要准备一下编程环境。1. 计算机 本文涉及的所有代码可以在**没有显存**的环境中执行。 我使用的机器配置为:
2025-02-14 20:39:59
1154
原创 本地大模型编程实战(15)初探智能体Agent(2)
在上一篇文章中,我们实践了如何使用 `langchain` 创建一个简单的 `ReAct Agent(智能体)`,这次我们升级一下玩法:实现一个可以调用两个 工具 的智能体。 其中一个工具用户查询天气预报,另外一个工具用来查询知识库,实际上该工具实现了 `RAG(Retrieval Augmented Generation,检索增强生成)`。
2025-02-14 20:38:02
1047
原创 本地大模型编程实战(14)初探智能体Agent(1)
在前面的文章中,我们了解了 `LLM(大语言模型)` 如何使用 `tool(工具)` ,现在我们开始进一步,初探 `Agent(智能体)` 的玩法。 其中的 `tool(工具)` 用于从矢量数据库中查询信息,这种方式在 `RAG(Retrieval Augmented Generation,检索增强生成)` 也很常用。在这种场景中,能否准确的查询出有用信息很关键,为此我们本次将使用多种大模型进行对比演练。
2025-02-11 19:04:01
1198
2
chatbox 1.17.0 web版本 docker镜像
2025-10-31
APOC(Awesome Procedures on Cypher)5.26.1
2025-04-25
在ASP.Net中通过cell-id和LAC获取位置信息
2010-12-30
自制单选(radiobox)和多选(checkbox)控件
2014-06-07
BugTracker.Net 3.5.7 中文版
2012-06-20
苏米团队账本 V0.51
2016-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅