自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 CS336 Assignment 2 (systems): Systems and Parallelism 翻译和实现

在本次作业中,我们将通过基准测试和性能分析不同规模的模型,以更好地理解性能变化规律。为了直观感受规模对性能的影响,我们将使用以下模型配置。所有模型的词汇表大小均为 10,000,批量大小(batch size)为 4,仅上下文长度(context length)不同。本次作业(及后续作业)需要呈现大量表格形式的结果,我们强烈建议你通过代码自动生成报告中的表格——因为手动用 LaTeX 或 Markdown 格式化表格非常繁琐。你可使用函数,或根据自己偏好的表格格式编写自定义生成函数。规模。

2025-12-10 16:42:40 641

原创 CS336 Assignment 1: Building a Transformer LM Spring 2025 翻译与实现

本次作业要求学生从零开始构建Transformer语言模型的关键组件,包括:1)基于字节对编码(BPE)的分词器,需实现Unicode编码处理、子词切分和词汇表训练;2)完整的Transformer语言模型架构;3)交叉熵损失函数和AdamW优化器;4)支持模型保存/加载的训练循环。学生将在TinyStories和OpenWebText数据集上分别训练分词器和语言模型,最终提交模型在测试集上的困惑度结果。作业要求避免直接使用PyTorch的高级API,强调底层实现

2025-11-12 17:00:10 626

原创 windows10安装WSL2 & ubuntu24.04中安装vLLM & vLLM中部署Qwen2.5-VL

本文记录下,如何使用vLLM部署模型。安装教程参考视频教程:https://www.bilibili.com/video/BV1BijSzfEmQ/。由于vLLM只支持Linux操作系统,所以首先安装WSL2。

2025-10-25 15:45:39 1257

原创 langchain_neo4j 以及 neo4j (windows-community) 的学习使用

从最后构建的图来看,实体是具体的数据,关系是我们提前定义的关系。langchain_neo4j工具就是借助LLM的力量,根据一段文本,和定义好的allowed_nodes、allowed_relationships,输入给LLMGraphTransformer,它会提取关键信息,然后构建neo4j语言的知识图谱。属于纯暴力新建方法;首先找到安装目录下,conf文件中的initial.dbms.default_database=xx ,然后把xx改成你想新建的数据库名,然后重启neo4j,就可以选择了。

2025-10-23 10:36:46 1028

原创 开源项目vanna-ai文档翻译:ai-sql-accuracy-2023-08-17.md

文档翻译 https://github.com/vanna-ai/vanna/blob/main/papers/ai-sql-accuracy-2023-08-17.mdAI生成SQL的准确性:通过测试不同大语言模型及上下文策略来最大化SQL生成准确率内容提要打造能够直接回答业务人员纯英文提问的自主AI智能体,这一前景虽然诱人但至今难以实现。许多人尝试让ChatGPT编写SQL查询语句,但成效有限,主要障碍在于大语言模型对特定查询数据集缺乏认知。

2025-10-13 10:43:52 729

原创 anthropics-claude-cookbooks学习记录02

今日学习:https://github.com/anthropics/anthropic-cookbook/tree/main/tool_use学习如何将 LLM 与外部工具和功能集成以扩展其能力。

2025-10-12 22:41:15 442

原创 langchain官网翻译:Build a Question/Answering system over SQL data

本文翻译自langchain官网:https://python.langchain.com/docs/tutorials/sql_qa/

2025-10-11 13:50:03 646

原创 anthropics-claude-cookbooks学习记录01

学习记录claude-cookbooks。今日学习:https://github.com/anthropics/claude-cookbooks/tree/main/patterns/agents。

2025-10-10 16:44:10 921

原创 anthropic博客翻译01:Building effective agents

在与众多致力于LLM智能体开发的团队合作过程中我们发现,一个现象始终贯穿不同行业:真正取得显著成效的,往往都是那些采用简洁、可组合模式的实施方案,而非复杂繁琐的框架体系。

2025-10-09 14:13:50 934

原创 langgraph官网翻译:workflows

本文翻译自langgraph官网:https://langchain-ai.github.io/langgraph/tutorials/workflows/

2025-10-08 11:04:44 987

原创 Project: Deep Agents with LangGraph 学习记录

博客只用于公开课程的学习记录(全英文看着费劲)。本文的完整代码,也可从笔者的下载。您将使用LangGraph的开源抽象架构。ReAct智能体是一种采用"推理与行动"框架的AI智能体,它将思维链推理与外部工具使用相结合。这一框架通过论文《ReAct: Synergizing Reasoning and Acting in Language Models》而广为人知。现在,我们希望扩展calculator的功能,记录所有已执行的运算操作。在状态(state)中添加一个list;

2025-09-28 16:26:45 1002

原创 langchain入门笔记03:使用fastapi部署本地大模型后端接口,优化局域网内的问答响应速度

在上一篇博客中,尝试构建了多种mcp_server。接下来考虑,如何将我们的多mcp_server给前端提供api接口。

2025-08-14 15:48:22 855

原创 langchain入门笔记02:几个实际应用

参考文献:本文仅仅用于学习记录langchain的基础内容。本文的完整代码,可从笔者的gitee下载。

2025-08-07 14:00:30 610

原创 从MySQL Workbench和Navicat导出导入.sql文件

首先打开软件右上角server中的,然后按照图片中的勾选,最后点击start export。

2025-08-07 10:34:55 337

原创 langchain入门笔记01

参考文献:本文仅仅用于学习记录langchain的基础内容。langchain中接入天气查询功能。在笔者的mcp入门博客中,有天气查询这个api更详细的记录。不在此赘述。# 接入自定义工具@tool"""查询即时天气函数:param loc: 必要参数,字符串类型,用于表示查询天气的具体城市名称,\注意,中国的城市需要用对应城市的英文名称代替:return: 解析之后的json格式对象"""params = {"q": loc,

2025-08-05 16:03:27 1208

原创 利用python的snap7读取S7-1200PLC的数据,保存并定时发送到邮箱中

本文介绍了如何利用Python读取西门子S7-1200 PLC的生产数据,并实现定时发送报表到指定邮箱的功能。通过snap7库读取PLC中的合格数和不合格数数据,保存为Excel文件后,使用SMTP协议自动发送邮件。系统设置为每天早上8点自动执行,可部署为长期运行的监控程序。该方案实现了生产数据的可视化监控和自动化报表发送,提高了质量管理效率。完整代码已开源在Gitee平台。

2025-07-08 16:31:59 693

原创 git的使用方法与实际操作(windows平台)

本文只用于记录,学习如何提交代码到gitee。参考文献:https://www.bilibili.com/video/BV1FE411P7B3/?

2025-04-28 10:56:49 1892

原创 MCP入门笔记2: MCP服务器开发流程,并以天气查询为例

上篇博客中,笔者熟悉了MCP客户端开发流程,使用client.py成功调用本地ollama。本文主要记录了MCP服务器开发流程,并实现了天气查询功能。

2025-04-25 15:31:15 1648

原创 MCP入门笔记1: MCP客户端开发流程,并接入ollama

第一章的笔记只是做浅层的了解。其中有ai帮我总结的内容,有的知识点我也不太理解…a. 大模型外部工具基本概念 b. MCP技术协议核心概念在 MCP 之前,开发者常常针对每个数据源或工具编写“​N×M​”次适配器,集成成本高且维护困难​。MCP 将外部功能抽象为三类接口——资源(Resources)、工具(Tools)、提示模板(Prompts),模型只需通过统一的 JSON-RPC 调用即可访问,多模型可重用同一套工具服务器​。

2025-04-24 14:18:16 2840

原创 Windows平台安装facefusion与实际应用

截至2025年,网络上涌现出众多优秀的开源AI工具。本文尝试使用开源工具FaceFusion(github源码)进行图片的初次尝试。

2025-04-16 11:10:53 3280

原创 一机多卡的GPU版本pytorch安装(Windows平台)

为了有效使用pytorch等深度学习工具,需要使用cuda工具。本文尝试在8张GeForce RTX 4090D的服务器上安装GPU版本的pytorch。在此之前,笔者只安装过单机单卡的cuda和torch,今天尝试安装了单机多卡的cuda和torch。简单记录一下。

2025-04-02 14:55:40 1392

原创 (Windows平台)基于RAGFlow中agent的text2sql尝试

上篇文章中,笔者在Windows平台安装了docker和RAGFlow,建立了本地知识库。本文接下来要介绍如何使用 RAGFlow 实现 Text2SQL。Text2SQL利用自然语言处理(NLP)技术,将用户用日常语言提出的问题..

2025-03-28 09:34:39 1807 2

原创 Windows安装docker并部署RAGFlow

在之前的博客中,笔者尝试利用ollama和anythingLLM建立了本地知识库,并在局域网内,提供接口给其他人使用。在本文中,笔者尝试利用另外一个工具RAGFlow,来搭建本地知识库。在大型语言模型(LLM)中,Embedding是指将离散的文本数据(如单词、短语或句子)转换为连续的数值向量的过程。​这些向量捕捉了文本的语义和语法特征。具体而言,Embedding将高维度的离散数据映射到低维度的连续向量空间中。​在这个空间中,语义相似的文本片段会被映射到彼此接近的位置。

2025-03-26 13:59:45 2538

原创 基于Ollama和AnythingLLM的API调用(局域网内可用)

上篇博客中,尝试Windows本地部署Ollama+DeepSeek-R1-7b+AnythingLLM,成功实现了本地知识库的检索。实际使用中,往往将DeepSeek装在性能好的机器上,其他机器只需远程访问。因此,本文将讨论如何调用API。以上就是利用Ollama和AnythingLLM的API调用的内容。笔者在实际使用中,发现了一些问题:第一,sources会跟随问答传递,如果sources数据量很大,就麻烦了;第二,前端调用api时,对于同一个对话的上下文,需要进一步优化;

2025-03-06 13:39:23 9172 6

原创 Windows本地部署Ollama+DeepSeek-R1-7b+AnythingLLM及应用

语言模型的有效应用可以给企业带来巨大经济效益,本文就介绍了Windows平台的部署所需要的模型的安装步骤并构建本地知识库。以上就是关于地道老北京炸酱面的制作方法(并不是),本文仅仅简单介绍了AnythingLLM的使用,而如何提供 API 接口供其他设备使用,敬请期待下一篇博客。

2025-03-05 10:12:51 1253 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除