自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(75)
  • 资源 (14)
  • 收藏
  • 关注

原创 如何选择FAISS的索引类型

本文将在**语义检索**领域探讨更加接近实战的话题:如何如何选择FAISS的索引类型。

2025-12-15 09:30:21 846

原创 程序员应该熟悉的概念(9)向量相似度(vector similarity)

由于这些向量相当于将文本做了分类:**语义相近的距离越近**,所以这些向量就可以很方便的应用于**语义检索**场景了。

2025-12-15 09:23:18 852

原创 程序员应该熟悉的概念(8)嵌入和语义检索

**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具,旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口,使用不同大模型。

2025-12-14 13:18:47 1100

原创 程序员应该熟悉的概念(7)vLLM和ollama

**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具,旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口,使用不同大模型。

2025-12-14 13:09:00 272

原创 程序员应该熟悉的概念(6)Fine-tuning和RAG

**大语言模型/LLM** 通常是由海量通用知识(如语法、常识、逻辑)训练的,在面对具体场景(如医疗问诊、法律文书生成)时,能力往往不足。 **Fine-tuning/微调** 正是为解决这一问题而生的核心技术,其本质是在预训练模型的基础上,用特定领域 / 任务的小数据集进一步训练,让模型 **适配具体需求**,最终输出更精准、更贴合场景的结果。

2025-12-12 11:46:50 987

原创 程序员应该熟悉的概念(5)MoE

**MoE**(Mixture of Experts,专家混合模型))是当前大模型(尤其是 GPT-4、Gemini、Mixtral、DeepSeek 等)架构中非常核心的一个概念。 **MoE** 的思想非常直白:不同的 `专家/Expert` 只负责处理自己擅长的那一类输入,而不是让整个模型的所有参数都去处理所有任务。

2025-12-12 11:43:17 898

原创 本地大模型编程实战(39)MCP实战演练

本文将使用`Visual Studio Code`写一个`MCP服务端`和`MCP客户端`,演示**MCP**的基本功能。

2025-12-11 11:56:42 1220

原创 程序员应该熟悉的概念(4)MCP能做什么

本文将更加深入的介绍 **MCP** 的架构和功能。

2025-12-11 11:52:16 768

原创 程序员应该熟悉的概念(3)MCP简介

**MCP**(Model Context Protocol) 是由 Anthropic 在 2024 年 11 月提出并开源的一个协议标准,目的是统一 AI 模型(尤其是大语言模型) 与外部资源 / 工具 / 数据源之间的交互方式。

2025-12-10 09:14:08 802

原创 本地大模型编程实战(38)实现一个通用的大模型客户端

由于大部分AI平台提供的API/接口都兼容 `OpenAI API` ,所以我们可以使用 `OpenAI SDK` 实现通用的 `LLM(大语言模型)` 客户端。

2025-12-10 09:07:39 1083

原创 程序员应该熟悉的概念(2)OpenAI API

大名鼎鼎的 **OpenAI** 发布之后,其 **OpenAI API规范** 逐渐成了事实上的工业标准,很多大模型API都兼容这个规范。这也就意味着:OpenAI的SDK可以使用很多大模型。

2025-12-09 12:22:34 423

原创 程序员应该熟悉的概念(1)RESTful

在这个前后端分离(前端和后端均为独立的应用,只通过API/接口通信)成为应用编程主流的时代,**RESTful** 规范(REST全称是:Representational State Transfer)应该是程序员**必须掌握**的API/接口设计规范。

2025-12-09 11:27:48 370

原创 本地大模型编程实战(37)使用知识图谱增强RAG(3)

本文将简单介绍如何使用 提升 **RAG(Retrieval Augmented Generation,检索增强生成)** 的问答效果。

2025-09-18 21:42:53 1156

原创 本地大模型编程实战(36)使用知识图谱增强RAG(2)生成知识图谱

本文将简单介绍如何把文本生成 **知识图谱**(Knowledge Graph)。具体来说,是使用开源项目 [AutoSchemaKG](https://github.com/HKUST-KnowComp/AutoSchemaKG) 生成 **GraphML** 。 **GraphML** 是 XML(Extensible Markup Language) 格式的文件,可以使用 **NetworkX** 等框架轻松处理这种格式的文件。

2025-09-18 21:40:02 899

原创 本地大模型编程实战(35)使用知识图谱增强RAG(1)知识图谱简介

知识图谱的主要特点是建立了“知识”之间的关联,所以它的强项是 **推理** ,**HugeGraph** 、**NetworkX** 支持 **PageRank**(在后面RAG中会用到)、k-短路、LPA(标签传播算法)、Jaccard 相似度 等算法。有了这些支持,它在 搜索引擎 、智能问答**RAG**(Retrieval Augmented Generation,检索增强生成) 等领域都有广泛的应用,可以明显提升这些领域应用的智能化水平。

2025-09-17 17:26:24 851

原创 本地大模型编程实战(34)使用faiss实现语义检索

**FAISS**(Facebook AI Similarity Search)是 Facebook AI 研究院开发的一款高效的向量相似性搜索库,专门用于优化大规模高维向量的近邻搜索任务,广泛应用于语义检索、图像检索、推荐系统等场景。 本文将详细介绍如何使用 **FAISS** 实现语义检索。具体内容包括: - 将内容矢量化并保存为索引 - 在保存索引的同时,保存每条信息的相关信息metadata - 通过矢量库进行语义检索

2025-09-17 17:23:46 1582

原创 使用NetworkX查询GraphML图数据

本文使用 **Nextworkx** 实现查询 **GraphML** 图数据的功能。 - 查询根节点,支持分页 - 查询某个节点的子图结构:即它的子节点以及子节点对应的边和下一级节点

2025-09-16 14:51:42 538

原创 内网的服务如何能在公网使用?

本文通过一个具体的例子来展示如何使用内网穿透工具frp将内网的web服务推向公网。

2025-09-16 14:43:19 795

原创 使用pyHugeGraph查询HugeGraph图数据

在实际项目中,我们经常会遇到类似下面的查询图数据库的需求: 1. 查询根节点,根节点可能有多个,需要**分页** 2. 点击根节点,查询其子节点以及子节点关联的边和更下一层的子节点 本文使用 **pyHugeGraph** 实现上述查询 **HugeGraph** 图数据库的功能。

2025-09-15 09:28:51 1040

原创 本地大模型编程实战(33)用SSE实现大模型的流式输出

我们使用大语言模型**qwen3**实现翻译功能。它可以自动识别源语言,就可以翻译为目标语种。 > 像千问这种大模型是基于多语言训练的,所以它支持中文、英文、法文、西班牙等多个语种的翻译。

2025-09-15 09:09:14 1190

原创 在windows系统中安装图数据库NEO4J

>`Neo4j`是一个高性能的`NOSQL`图形数据库,它将结构化数据存储在网络上而不是表中。 >`Neo4j`也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。本文讲述了在如何在`windows`系统中安装`NEO4J`。

2025-05-09 14:20:54 723

原创 本地大模型编程实战(32)用websocket显示大模型的流式输出

本文将模仿后端流式输出文字,前端一块一块的显示文字。主要的实现路径是:- `LLM` 采用 `qwen3` ,使用 `stream` 方式输出 - 后端使用 `langchain` 框架- 使用 `fastapi` 实现后端接口 - 前后端之间使用 **`websocket`** 长连接通信- 前端使用一个简单的 `html5` 网页做演示

2025-05-02 17:45:48 1748

原创 本地大模型编程实战(31)用Map-Reduce从大文本中提取摘要

在执行从文本中提取摘要的任务时,难免遇到大文本的情况:文本的长度超出了 `LLM(大语言模型)` 的token限制。 `LangGraph` 提供了 `map-reduce` 工作流,它先把大文本拆成小文档分别提取摘要,然后再提炼/压缩提取的摘要,直到最后提取的摘要的token长度满足既定要求。

2025-05-01 10:19:01 855

原创 本地大模型编程实战(30)从文本提取摘要

本文将演练如何使用 `LLM(大语言模型)` 提取文本摘要。

2025-05-01 10:00:18 581

原创 本地大模型编程实战(29)查询图数据库NEO4J(2)

上一篇文章 [用大语言模型LLM查询图数据库NEO4J(1)]介绍了使用`GraphQACypherChain`查询`NEO4J`。用它实现简单快捷,但是不容易定制,在生产环境中可能会面临挑战。本文将基于`langgraph` 框架,用`LLM(大语言模型)`查询图数据库`NEO4J`。它可以定义清晰复杂的工作流,能应对比较复杂的应用场景。

2025-04-29 16:22:58 1300

原创 本地大模型编程实战(28)查询图数据库NEO4J(1)

本文将基于`langchain` 框架,用`LLM(大语言模型)`查询图数据库`NEO4J`。

2025-04-29 16:05:47 825

原创 本地大模型编程实战(27)初探langgraph的流式输出

对于 `LLM(大语言模型)`,流式传输已成为一种越来越受欢迎的功能。其理念是在 `LLM` 生成令牌时就快速返回,而不是等待创建完整响应后再返回全部内容。对于简单的场景,流式传输实际上非常容易实现,但当涉及到智能体之类的应用时,它会变得复杂,这些智能体有自己的运行逻辑,可能会阻止我们尝试进行流式传输。本文将探讨 `langchain` 的流式输出,后面将实现**智能体最终结果的流式输出**。

2025-02-28 16:38:20 1999

原创 本地大模型编程实战(26)用langgraph实现基于SQL数据构建的问答系统(5)

本文将将扩展上一篇文章完成的 `langgraph` 链,继续使用基于 `langgraph` 链 ,对结构化数据库 `SQlite` 进行查询的方法。该系统建立以后,我们不需要掌握专业的 `SQL` 技能,可以用自然语言询问有关数据库中数据的问题并返回答案。主要完善一下两点内容: - 自动记录消息历史- 增加人工审核环节,防止 `LLM(大语言模型)` 运行危险的SQL语句

2025-02-28 16:32:10 1087

原创 本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)

本文将演练使用基于 `langgraph` 链 ,对结构化数据库 `SQlite` 进行查询的方法。该系统建立以后,我们不需要掌握专业的 `SQL` 技能,可以用自然语言询问有关数据库中数据的问题并返回答案。 使 `大语言模型(LLM)` 查询结构化数据与非结构化文本数据有所不同。查询非结构化数据时,通常需要将待查询的文本嵌入到向量数据库中;而查询结构化数据的方法则是让 `LLM` 编写和执行 `DSL`(例如 SQL)进行查询。

2025-02-26 09:23:02 1323

原创 本地大模型编程实战(24)用智能体(Agent)实现智能纠错的SQL数据库问答系统(3)

本文将实现这样一个 `智能体(Agent)` :- 可以使用自然语言对 `SQLite` 数据库进行查询。即:用户用自然语言提出问题,智能体也用自然语言根据数据库的查询结果回答问题。- 增加一个自动对查询中的专有名词进行纠错的工具,这将明显提升查询的准确性。

2025-02-26 09:19:21 1374

原创 本地大模型编程实战(23)用智能体(Agent)实现基于SQL数据构建问答系统(2)

本文将用 `智能体(Agent)` 实现对 `SQLite` 数据库的查询:用户用自然语言提出问题,智能体也用自然语言根据数据库的查询结果回答问题。

2025-02-25 14:39:02 1474

原创 本地大模型编程实战(22)用langchain实现基于SQL数据构建问答系统(1)

使 `LLM(大语言模型)` 系统能够查询结构化数据与非结构化文本数据在性质上可能不同。后者通常生成可在向量数据库中搜索的文本,而结构化数据的方法通常是让 `LLM` 编写和执行 `DSL`(例如 SQL)中的查询。 我们将演练在使用基于 `langchain` 链 ,在结构化数据库 `SQlite` 中的数据上创建问答系统的基本方法,该系统建立以后,我们用自然语言询问有关数据库中数据的问题并返回自然语言答案。

2025-02-25 14:36:48 1536

原创 本地大模型编程实战(21)支持多参数检索的RAG(Retrieval Augmented Generation,检索增强生成)(5)

在实现 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统的时候,在检索(retrieve)知识库时通常一个参数。 本文将演练更复杂一点的情况:通过两个参数进行知识库的检索。为此会在 `langgraph`链 中增加一个 `analyze_query` 节点,它用来基于用户问题推理检索的参数。

2025-02-24 11:23:12 1012

原创 本地大模型编程实战(20)用langgraph和智能体实现RAG(Retrieval Augmented Generation,检索增强生成)(4)

上一篇文章我们演练了一个 [用 `langgraph` 实现的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统]。本文将要在此基础上,增加自动记录聊天历史的功能,另外,我们还将使用一个 `Agent(智能体)` 来实现几乎同样的功能,我们来一起体会一下用 `langgraph` 和 `Agent(智能体)` 实现 `RAG系统` 的区别。

2025-02-24 11:18:48 2321 2

原创 本地大模型编程实战(19)RAG(Retrieval Augmented Generation,检索增强生成)(3)

上一篇文章我们演练了一个 [用 `langgraph` 实现的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统](http://wfcoding.com/articles/practice/0318/)。本文将要创建的系统将更加智能:如果在知识库中未找到靠谱的文档,则用 `LLM(大语言模型)` 自身的能力弥补。

2025-02-16 20:59:00 1461

原创 本地大模型编程实战(18)RAG(Retrieval Augmented Generation,检索增强生成)(2)

本文将使用 `langgraph` 实现一个简单的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统。> 使用 `qwen2.5` 、 `deepseek-r1` 以及 `llama3.1` 做实验,用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。

2025-02-16 16:31:20 1083

原创 本地大模型编程实战(17)RAG(Retrieval Augmented Generation,检索增强生成)(1)

本文将用实际代码演练一个简单的 `RAG(Retrieval Augmented Generation,检索增强生成)` 系统。> 我们将使用 `qwen2.5` 、 `deepseek-r1` 以及 `llama3.1` 做实验,用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。

2025-02-16 11:56:11 1264

原创 本地大模型编程实战(16)初探智能体Agent(3)

本文将基于上一篇文章完善 `Agent(智能体)` ,主要完善的功能有: - 跟踪 `Agent(智能体)` 的执行过程- 记录消息历史> 此次我们使用 `qwen2.5` 做 `LLM(大语言模型)` 驱动 `Agent(智能体)` ,使用 `shaw/dmeta-embedding-zh` 做中文嵌入和检索。<!--more-->## 准备在正式开始撸代码之前,需要准备一下编程环境。1. 计算机 本文涉及的所有代码可以在**没有显存**的环境中执行。 我使用的机器配置为:

2025-02-14 20:39:59 1154

原创 本地大模型编程实战(15)初探智能体Agent(2)

在上一篇文章中,我们实践了如何使用 `langchain` 创建一个简单的 `ReAct Agent(智能体)`,这次我们升级一下玩法:实现一个可以调用两个 工具 的智能体。 其中一个工具用户查询天气预报,另外一个工具用来查询知识库,实际上该工具实现了 `RAG(Retrieval Augmented Generation,检索增强生成)`。

2025-02-14 20:38:02 1047

原创 本地大模型编程实战(14)初探智能体Agent(1)

在前面的文章中,我们了解了 `LLM(大语言模型)` 如何使用 `tool(工具)` ,现在我们开始进一步,初探 `Agent(智能体)` 的玩法。 其中的 `tool(工具)` 用于从矢量数据库中查询信息,这种方式在 `RAG(Retrieval Augmented Generation,检索增强生成)` 也很常用。在这种场景中,能否准确的查询出有用信息很关键,为此我们本次将使用多种大模型进行对比演练。

2025-02-11 19:04:01 1198 2

chatbox 1.17.0 web版本 docker镜像

chatbox 1.17.0[https://github.com/chatboxai/chatbox/releases/tag/v1.17.0] docker镜像,纯web版本,可以部署在docker环境下,部署完毕后,可以直接用浏览器访问。

2025-10-31

APOC(Awesome Procedures on Cypher)5.26.1

APOC(Awesome Procedures on Cypher)是Neo4j图数据库的一个插件,它提供了一组强大的过程和函数,扩展了Cypher查询语言的功能。 APOC可以帮助你进行更高级的数据处理和操作,例如导入和导出数据、动态创建节点和关系、执行事务操作等。

2025-04-25

open sdk 21 下载文件

完整的open sdk 21压缩包。

2025-04-25

Git-2.46.0-64-bit,windows 64位git客户端

Git-2.46.0-64-bit,windows 64位git客户端

2024-08-27

Bitwise SSH Client 9.39,免费的SSH客户端

这是一款非常好用的免费的SSH客户端,应该能成为您运维的好帮手。

2024-08-19

MTK中使用socket实现http的get请求

自己写的http get的实现。希望能对初学者有所帮助,更希望牛人能对此提出好的建议。

2010-12-03

在ASP.Net中通过cell-id和LAC获取位置信息

本示例代码展示了如何使用ASP.Net,通过Google Geolocation API Network Protocol,在知道cell-id和LAC的情况下,获取经纬度信息。

2010-12-30

SQLite使用代码示例(使用ASP.Net交互)

使用ASP.Net演示了开发中使用SQLite的基本方法,建议使用SQLite Developer管理SQLite数据库。

2012-12-02

cocos2d-x手机游戏开发 源代码

徐松林《cocos2d-x 手机游戏开发》练习时用的源代码,基于cocos2d-1.0.1-x-0.9.2,仅供参考。

2012-08-20

代码面试最常用的10大算法完整版

代码面试最常用的10大算法的中文完整版(部分中文,部分英文)及英文原版。

2014-05-20

cocos2d-x小游戏小狗快跑源码

cocos2d-x小狗快跑完整源码,其中的代码和资源仅供个人研究,请勿商用,谢谢。

2016-01-21

自制单选(radiobox)和多选(checkbox)控件

最近想学者用js做适合触摸的单选(radiobox)和多选(checkbox)控件,起因是:1、不想用就jQuery,因为用它就解决这么一个问题感觉有点像大炮打蚊子;2、想用css做出toggle switch那种感觉很困难,而且这种开关只支持开和关两种状态,如果有很多状态的话,就不好办了。 基本思路是在用一个div包住各选项,在div中防止N个label(别的控件也行)来做选项,每个选项的值用title属性代表,最终选择的结果则存储在该div的title中,模仿jQuery的基本思路,主要逻辑用javascript实现。

2014-06-07

.net的事件,委托和线程的关系代码

该样例代码展示了.net中事件和委托的基本用法,同时阐述了它们和线程之间的关系,最后用一个多线程的实例解决了并行发布/订阅处理消息的问题。

2013-05-02

BugTracker.Net 3.5.7 中文版

BugTracker.Net 3.5.7是一款用.Net开发的开源bug管理工具,基于GNU通用公共许可证的条款,其突出特点是易于安装、简单实用,非常适合中小开发团队。 它有一个非常实用的截屏工具btnet_screen_capture,截图完毕后可直接上传bug信息。在对此工具进行简单配置以后,上传bug信息相当便捷高效。 如果您熟悉微软的开发工具,想找一款易用使用的bug管理工具,那么它非常适合您。 因为时间关系和作者水平有限,只是把绝大部分常用的功能汉化了,敬请谅解。

2012-06-20

使用Javascript实现遮屏效果

用js生成动态新的div,遮挡住当前屏幕。

2014-05-21

7-Zip超酷免费开源压缩工具

非常酷的免费的,开源的压缩工具,据说比WinRAR压缩比还大呢。

2010-11-03

苏米团队账本

主要包含现金流水、应收应付以及按照项目、按照人员、按照日期的统计查询功能,解决了一般的小团队的记账和按项目、人员考核以及成本分摊的问题。

2016-11-25

苏米团队账本 V0.51

这是一款非常实用的财务管理软件,它可以有效解决一般小团队的记账和按项目、人员考核以及成本分摊的问题,功能十分多样化。 主要功能包括: 1、记录和查询流水账 2、记录项目基本信息 3、跟踪项目应收应付 4、人员信息管理 5、按项目、按人员、按日期统计费用 该工具特点鲜明: 免费 所有功能都是免费使用的,没有任何附带条件。 绿色 下载后解压就能用,不喜欢用直接删掉即可,不需要安装,卸载,更不用担心它会偷偷的在您的操作系统里干些灰色的事情,也不用担心卸载不干净。 好用 软件是单机版,C/S结构,非专业财务人员不用经过任何指导就能上手使用。 V0.51 1、修复了流水中可能不显示项目名称的问题。 升级方法: 1、在程序根目录下把sumia.db备份出来,所有的数据都存储在这里面; 2、解压或者运行安装包; 3、把备份出来的sumia.db拷贝到新版本的根目录下,覆盖新版本的sumia.db; 4、启动新版本

2016-12-21

SmartSniff

非常好用,小巧的一款网络抓包工具,尤其比较适合抓取HTTP数据包,对调试web应用非常有帮助。

2010-11-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除