火云牌神-优快云博客

原创如何选择FAISS的索引类型

本文将在**语义检索**领域探讨更加接近实战的话题：如何如何选择FAISS的索引类型。

2025-12-15 09:30:21 846

原创程序员应该熟悉的概念(9)向量相似度（vector similarity）

由于这些向量相当于将文本做了分类：**语义相近的距离越近**，所以这些向量就可以很方便的应用于**语义检索**场景了。

2025-12-15 09:23:18 852

原创程序员应该熟悉的概念(8)嵌入和语义检索

**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具，旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口，使用不同大模型。

2025-12-14 13:18:47 1100

原创程序员应该熟悉的概念(6)Fine-tuning和RAG

**大语言模型/LLM** 通常是由海量通用知识（如语法、常识、逻辑）训练的，在面对具体场景（如医疗问诊、法律文书生成）时，能力往往不足。 **Fine-tuning/微调** 正是为解决这一问题而生的核心技术，其本质是在预训练模型的基础上，用特定领域 / 任务的小数据集进一步训练，让模型 **适配具体需求**，最终输出更精准、更贴合场景的结果。

2025-12-12 11:46:50 987

原创程序员应该熟悉的概念(5)MoE

**MoE**(Mixture of Experts,专家混合模型）)是当前大模型（尤其是 GPT-4、Gemini、Mixtral、DeepSeek 等）架构中非常核心的一个概念。 **MoE** 的思想非常直白：不同的 `专家/Expert` 只负责处理自己擅长的那一类输入，而不是让整个模型的所有参数都去处理所有任务。

2025-12-12 11:43:17 898

原创本地大模型编程实战(39)MCP实战演练

本文将使用`Visual Studio Code`写一个`MCP服务端`和`MCP客户端`，演示**MCP**的基本功能。

2025-12-11 11:56:42 1220

原创程序员应该熟悉的概念(4)MCP能做什么

本文将更加深入的介绍 **MCP** 的架构和功能。

2025-12-11 11:52:16 768

原创程序员应该熟悉的概念(3)MCP简介

**MCP**(Model Context Protocol) 是由 Anthropic 在 2024 年 11 月提出并开源的一个协议标准，目的是统一 AI 模型（尤其是大语言模型）与外部资源 / 工具 / 数据源之间的交互方式。

2025-12-10 09:14:08 802

原创本地大模型编程实战(38)实现一个通用的大模型客户端

由于大部分AI平台提供的API/接口都兼容 `OpenAI API` ,所以我们可以使用 `OpenAI SDK` 实现通用的 `LLM（大语言模型）` 客户端。

2025-12-10 09:07:39 1083

原创程序员应该熟悉的概念(2)OpenAI API

大名鼎鼎的 **OpenAI** 发布之后，其 **OpenAI API规范** 逐渐成了事实上的工业标准，很多大模型API都兼容这个规范。这也就意味着：OpenAI的SDK可以使用很多大模型。

2025-12-09 12:22:34 423

原创程序员应该熟悉的概念(1)RESTful

在这个前后端分离（前端和后端均为独立的应用，只通过API/接口通信）成为应用编程主流的时代，**RESTful** 规范（REST全称是：Representational State Transfer）应该是程序员**必须掌握**的API/接口设计规范。

2025-12-09 11:27:48 370

原创本地大模型编程实战(37)使用知识图谱增强RAG(3)

本文将简单介绍如何使用提升 **RAG(Retrieval Augmented Generation,检索增强生成)** 的问答效果。

2025-09-18 21:42:53 1156

原创本地大模型编程实战(36)使用知识图谱增强RAG(2)生成知识图谱

本文将简单介绍如何把文本生成 **知识图谱**（Knowledge Graph）。具体来说，是使用开源项目 [AutoSchemaKG](https://github.com/HKUST-KnowComp/AutoSchemaKG) 生成 **GraphML** 。 **GraphML** 是 XML（Extensible Markup Language）格式的文件，可以使用 **NetworkX** 等框架轻松处理这种格式的文件。

2025-09-18 21:40:02 899

原创本地大模型编程实战(35)使用知识图谱增强RAG(1)知识图谱简介

知识图谱的主要特点是建立了“知识”之间的关联，所以它的强项是 **推理** ，**HugeGraph** 、**NetworkX** 支持 **PageRank**（在后面RAG中会用到）、k-短路、LPA（标签传播算法）、Jaccard 相似度等算法。有了这些支持，它在搜索引擎、智能问答**RAG**（Retrieval Augmented Generation,检索增强生成）等领域都有广泛的应用，可以明显提升这些领域应用的智能化水平。

2025-09-17 17:26:24 851

原创本地大模型编程实战(34)使用faiss实现语义检索

**FAISS**（Facebook AI Similarity Search）是 Facebook AI 研究院开发的一款高效的向量相似性搜索库，专门用于优化大规模高维向量的近邻搜索任务，广泛应用于语义检索、图像检索、推荐系统等场景。本文将详细介绍如何使用 **FAISS** 实现语义检索。具体内容包括： - 将内容矢量化并保存为索引 - 在保存索引的同时，保存每条信息的相关信息metadata - 通过矢量库进行语义检索

2025-09-17 17:23:46 1582

原创使用NetworkX查询GraphML图数据

本文使用 **Nextworkx** 实现查询 **GraphML** 图数据的功能。 - 查询根节点，支持分页 - 查询某个节点的子图结构：即它的子节点以及子节点对应的边和下一级节点

2025-09-16 14:51:42 538

原创内网的服务如何能在公网使用？

本文通过一个具体的例子来展示如何使用内网穿透工具frp将内网的web服务推向公网。

2025-09-16 14:43:19 795

原创使用pyHugeGraph查询HugeGraph图数据

在实际项目中，我们经常会遇到类似下面的查询图数据库的需求： 1. 查询根节点，根节点可能有多个，需要**分页** 2. 点击根节点，查询其子节点以及子节点关联的边和更下一层的子节点本文使用 **pyHugeGraph** 实现上述查询 **HugeGraph** 图数据库的功能。

2025-09-15 09:28:51 1040

原创本地大模型编程实战(33)用SSE实现大模型的流式输出

我们使用大语言模型**qwen3**实现翻译功能。它可以自动识别源语言，就可以翻译为目标语种。 > 像千问这种大模型是基于多语言训练的，所以它支持中文、英文、法文、西班牙等多个语种的翻译。

2025-09-15 09:09:14 1190

原创在windows系统中安装图数据库NEO4J

>`Neo4j`是一个高性能的`NOSQL`图形数据库，它将结构化数据存储在网络上而不是表中。 >`Neo4j`也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。本文讲述了在如何在`windows`系统中安装`NEO4J`。

2025-05-09 14:20:54 723

原创本地大模型编程实战(32)用websocket显示大模型的流式输出

本文将模仿后端流式输出文字，前端一块一块的显示文字。主要的实现路径是：- `LLM` 采用 `qwen3` ，使用 `stream` 方式输出 - 后端使用 `langchain` 框架- 使用 `fastapi` 实现后端接口 - 前后端之间使用 **`websocket`** 长连接通信- 前端使用一个简单的 `html5` 网页做演示

2025-05-02 17:45:48 1748

原创本地大模型编程实战(31)用Map-Reduce从大文本中提取摘要

在执行从文本中提取摘要的任务时，难免遇到大文本的情况：文本的长度超出了 `LLM(大语言模型)` 的token限制。 `LangGraph` 提供了 `map-reduce` 工作流，它先把大文本拆成小文档分别提取摘要，然后再提炼/压缩提取的摘要，直到最后提取的摘要的token长度满足既定要求。

2025-05-01 10:19:01 855

原创本地大模型编程实战(30)从文本提取摘要

本文将演练如何使用 `LLM(大语言模型)` 提取文本摘要。

2025-05-01 10:00:18 581

原创本地大模型编程实战(29)查询图数据库NEO4J(2)

上一篇文章 [用大语言模型LLM查询图数据库NEO4J(1)]介绍了使用`GraphQACypherChain`查询`NEO4J`。用它实现简单快捷，但是不容易定制，在生产环境中可能会面临挑战。本文将基于`langgraph` 框架，用`LLM(大语言模型)`查询图数据库`NEO4J`。它可以定义清晰复杂的工作流，能应对比较复杂的应用场景。

2025-04-29 16:22:58 1300

原创本地大模型编程实战(28)查询图数据库NEO4J(1)

本文将基于`langchain` 框架，用`LLM(大语言模型)`查询图数据库`NEO4J`。

2025-04-29 16:05:47 825

原创本地大模型编程实战(27)初探langgraph的流式输出

对于 `LLM(大语言模型)`，流式传输已成为一种越来越受欢迎的功能。其理念是在 `LLM` 生成令牌时就快速返回，而不是等待创建完整响应后再返回全部内容。对于简单的场景，流式传输实际上非常容易实现，但当涉及到智能体之类的应用时，它会变得复杂，这些智能体有自己的运行逻辑，可能会阻止我们尝试进行流式传输。本文将探讨 `langchain` 的流式输出，后面将实现**智能体最终结果的流式输出**。

2025-02-28 16:38:20 1999

原创本地大模型编程实战(26)用langgraph实现基于SQL数据构建的问答系统(5)

本文将将扩展上一篇文章完成的 `langgraph` 链，继续使用基于 `langgraph` 链，对结构化数据库 `SQlite` 进行查询的方法。该系统建立以后，我们不需要掌握专业的 `SQL` 技能，可以用自然语言询问有关数据库中数据的问题并返回答案。主要完善一下两点内容： - 自动记录消息历史- 增加人工审核环节，防止 `LLM(大语言模型)` 运行危险的SQL语句

2025-02-28 16:32:10 1087

原创本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)

本文将演练使用基于 `langgraph` 链，对结构化数据库 `SQlite` 进行查询的方法。该系统建立以后，我们不需要掌握专业的 `SQL` 技能，可以用自然语言询问有关数据库中数据的问题并返回答案。使 `大语言模型(LLM)` 查询结构化数据与非结构化文本数据有所不同。查询非结构化数据时，通常需要将待查询的文本嵌入到向量数据库中；而查询结构化数据的方法则是让 `LLM` 编写和执行 `DSL`（例如 SQL）进行查询。

2025-02-26 09:23:02 1323

原创本地大模型编程实战(24)用智能体(Agent)实现智能纠错的SQL数据库问答系统(3)

本文将实现这样一个 `智能体(Agent)` ：- 可以使用自然语言对 `SQLite` 数据库进行查询。即：用户用自然语言提出问题，智能体也用自然语言根据数据库的查询结果回答问题。- 增加一个自动对查询中的专有名词进行纠错的工具，这将明显提升查询的准确性。

2025-02-26 09:19:21 1374

原创本地大模型编程实战(23)用智能体(Agent)实现基于SQL数据构建问答系统(2)

本文将用 `智能体(Agent)` 实现对 `SQLite` 数据库的查询：用户用自然语言提出问题，智能体也用自然语言根据数据库的查询结果回答问题。

2025-02-25 14:39:02 1474

原创本地大模型编程实战(22)用langchain实现基于SQL数据构建问答系统(1)

使 `LLM(大语言模型)` 系统能够查询结构化数据与非结构化文本数据在性质上可能不同。后者通常生成可在向量数据库中搜索的文本，而结构化数据的方法通常是让 `LLM` 编写和执行 `DSL`（例如 SQL）中的查询。我们将演练在使用基于 `langchain` 链，在结构化数据库 `SQlite` 中的数据上创建问答系统的基本方法，该系统建立以后，我们用自然语言询问有关数据库中数据的问题并返回自然语言答案。

2025-02-25 14:36:48 1536

原创本地大模型编程实战(21)支持多参数检索的RAG(Retrieval Augmented Generation,检索增强生成)(5)

在实现 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统的时候，在检索（retrieve）知识库时通常一个参数。本文将演练更复杂一点的情况：通过两个参数进行知识库的检索。为此会在 `langgraph`链中增加一个 `analyze_query` 节点，它用来基于用户问题推理检索的参数。

2025-02-24 11:23:12 1012

原创本地大模型编程实战(20)用langgraph和智能体实现RAG(Retrieval Augmented Generation,检索增强生成)(4)

上一篇文章我们演练了一个 [用 `langgraph` 实现的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统]。本文将要在此基础上，增加自动记录聊天历史的功能，另外，我们还将使用一个 `Agent(智能体)` 来实现几乎同样的功能，我们来一起体会一下用 `langgraph` 和 `Agent(智能体)` 实现 `RAG系统` 的区别。

2025-02-24 11:18:48 2321 2

原创本地大模型编程实战(19)RAG(Retrieval Augmented Generation,检索增强生成)(3)

上一篇文章我们演练了一个 [用 `langgraph` 实现的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统](http://wfcoding.com/articles/practice/0318/)。本文将要创建的系统将更加智能：如果在知识库中未找到靠谱的文档，则用 `LLM(大语言模型)` 自身的能力弥补。

2025-02-16 20:59:00 1461

原创本地大模型编程实战(18)RAG(Retrieval Augmented Generation,检索增强生成)(2)

本文将使用 `langgraph` 实现一个简单的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统。> 使用 `qwen2.5` 、 `deepseek-r1` 以及 `llama3.1` 做实验，用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。

2025-02-16 16:31:20 1083

原创本地大模型编程实战(17)RAG(Retrieval Augmented Generation,检索增强生成)(1)

本文将用实际代码演练一个简单的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统。> 我们将使用 `qwen2.5` 、 `deepseek-r1` 以及 `llama3.1` 做实验，用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。

2025-02-16 11:56:11 1264

原创本地大模型编程实战(16)初探智能体Agent(3)

本文将基于上一篇文章完善 `Agent(智能体)` ，主要完善的功能有： - 跟踪 `Agent(智能体)` 的执行过程- 记录消息历史> 此次我们使用 `qwen2.5` 做 `LLM（大语言模型）` 驱动 `Agent(智能体)` ，使用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。## 准备在正式开始撸代码之前，需要准备一下编程环境。1. 计算机本文涉及的所有代码可以在**没有显存**的环境中执行。我使用的机器配置为：

2025-02-14 20:39:59 1154

原创本地大模型编程实战(15)初探智能体Agent(2)

在上一篇文章中，我们实践了如何使用 `langchain` 创建一个简单的 `ReAct Agent(智能体)`，这次我们升级一下玩法：实现一个可以调用两个工具的智能体。其中一个工具用户查询天气预报，另外一个工具用来查询知识库，实际上该工具实现了 `RAG(Retrieval Augmented Generation,检索增强生成)`。

2025-02-14 20:38:02 1047

原创本地大模型编程实战(14)初探智能体Agent(1)

在前面的文章中，我们了解了 `LLM(大语言模型)` 如何使用 `tool(工具)` ，现在我们开始进一步，初探 `Agent(智能体)` 的玩法。其中的 `tool(工具)` 用于从矢量数据库中查询信息，这种方式在 `RAG(Retrieval Augmented Generation,检索增强生成)` 也很常用。在这种场景中，能否准确的查询出有用信息很关键，为此我们本次将使用多种大模型进行对比演练。

2025-02-11 19:04:01 1198 2

chatbox 1.17.0 web版本 docker镜像

chatbox 1.17.0[https://github.com/chatboxai/chatbox/releases/tag/v1.17.0] docker镜像，纯web版本，可以部署在docker环境下，部署完毕后，可以直接用浏览器访问。

2025-10-31

APOC（Awesome Procedures on Cypher）5.26.1

APOC（Awesome Procedures on Cypher）是Neo4j图数据库的一个插件，它提供了一组强大的过程和函数，扩展了Cypher查询语言的功能。 APOC可以帮助你进行更高级的数据处理和操作，例如导入和导出数据、动态创建节点和关系、执行事务操作等。

2025-04-25

open sdk 21 下载文件

完整的open sdk 21压缩包。

2025-04-25

Git-2.46.0-64-bit，windows 64位git客户端

2024-08-27

Bitwise SSH Client 9.39，免费的SSH客户端

这是一款非常好用的免费的SSH客户端，应该能成为您运维的好帮手。

2024-08-19

MTK中使用socket实现http的get请求

自己写的http get的实现。希望能对初学者有所帮助，更希望牛人能对此提出好的建议。

2010-12-03

在ASP.Net中通过cell-id和LAC获取位置信息

本示例代码展示了如何使用ASP.Net，通过Google Geolocation API Network Protocol，在知道cell-id和LAC的情况下，获取经纬度信息。

2010-12-30

SQLite使用代码示例(使用ASP.Net交互)

使用ASP.Net演示了开发中使用SQLite的基本方法，建议使用SQLite Developer管理SQLite数据库。

2012-12-02

cocos2d-x手机游戏开发源代码

徐松林《cocos2d-x 手机游戏开发》练习时用的源代码，基于cocos2d-1.0.1-x-0.9.2，仅供参考。

2012-08-20

代码面试最常用的10大算法完整版

代码面试最常用的10大算法的中文完整版（部分中文，部分英文）及英文原版。

2014-05-20

cocos2d-x小游戏小狗快跑源码

cocos2d-x小狗快跑完整源码，其中的代码和资源仅供个人研究，请勿商用，谢谢。

2016-01-21

自制单选（radiobox）和多选(checkbox)控件

最近想学者用js做适合触摸的单选（radiobox）和多选(checkbox)控件，起因是：1、不想用就jQuery，因为用它就解决这么一个问题感觉有点像大炮打蚊子；2、想用css做出toggle switch那种感觉很困难，而且这种开关只支持开和关两种状态，如果有很多状态的话，就不好办了。基本思路是在用一个div包住各选项，在div中防止N个label（别的控件也行）来做选项，每个选项的值用title属性代表，最终选择的结果则存储在该div的title中，模仿jQuery的基本思路，主要逻辑用javascript实现。

2014-06-07

.net的事件,委托和线程的关系代码

该样例代码展示了.net中事件和委托的基本用法，同时阐述了它们和线程之间的关系，最后用一个多线程的实例解决了并行发布/订阅处理消息的问题。

2013-05-02

BugTracker.Net 3.5.7 中文版

BugTracker.Net 3.5.7是一款用.Net开发的开源bug管理工具，基于GNU通用公共许可证的条款，其突出特点是易于安装、简单实用，非常适合中小开发团队。它有一个非常实用的截屏工具btnet_screen_capture，截图完毕后可直接上传bug信息。在对此工具进行简单配置以后，上传bug信息相当便捷高效。如果您熟悉微软的开发工具，想找一款易用使用的bug管理工具，那么它非常适合您。因为时间关系和作者水平有限，只是把绝大部分常用的功能汉化了，敬请谅解。

2012-06-20

使用Javascript实现遮屏效果

用js生成动态新的div，遮挡住当前屏幕。

2014-05-21

7-Zip超酷免费开源压缩工具

非常酷的免费的，开源的压缩工具，据说比WinRAR压缩比还大呢。

2010-11-03

苏米团队账本

主要包含现金流水、应收应付以及按照项目、按照人员、按照日期的统计查询功能，解决了一般的小团队的记账和按项目、人员考核以及成本分摊的问题。

2016-11-25

苏米团队账本 V0.51

这是一款非常实用的财务管理软件，它可以有效解决一般小团队的记账和按项目、人员考核以及成本分摊的问题，功能十分多样化。主要功能包括： 1、记录和查询流水账 2、记录项目基本信息 3、跟踪项目应收应付 4、人员信息管理 5、按项目、按人员、按日期统计费用该工具特点鲜明：免费所有功能都是免费使用的，没有任何附带条件。绿色下载后解压就能用，不喜欢用直接删掉即可，不需要安装，卸载，更不用担心它会偷偷的在您的操作系统里干些灰色的事情，也不用担心卸载不干净。好用软件是单机版，C/S结构，非专业财务人员不用经过任何指导就能上手使用。 V0.51 1、修复了流水中可能不显示项目名称的问题。升级方法： 1、在程序根目录下把sumia.db备份出来，所有的数据都存储在这里面； 2、解压或者运行安装包； 3、把备份出来的sumia.db拷贝到新版本的根目录下，覆盖新版本的sumia.db； 4、启动新版本

2016-12-21

SmartSniff

非常好用，小巧的一款网络抓包工具，尤其比较适合抓取HTTP数据包，对调试web应用非常有帮助。

2010-11-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人