- 博客(165)
- 收藏
- 关注
原创 Failed to load model class ‘MPLCanvasModel‘ from module ‘jupyter-matplotlib‘ Error: No version of mo
摘要:JupyterLab加载jupyter-matplotlib模块失败,提示"未注册模块版本"。解决方案包括:1) 确保正确安装ipympl;2) 检查JupyterLab扩展;3) 验证环境路径避免冲突;4) 清理浏览器和JupyterLab缓存。若问题持续,可尝试重建JupyterLab或创建新内核。建议在修改后重启服务并运行测试代码验证。此问题通常由环境混乱或扩展未正确安装导致,需确保运行环境与安装环境一致。
2025-09-06 18:14:22
770
原创 【AI应用开发】RAG系列(2)——嵌入模型(Embedding Model)
嵌入模型(Embedding Model)是一种将离散的、高维的数据(如单词、句子、整个文档)转换为连续的、低维的向量表示(即嵌入向量,Embedding Vector)的数学模型。
2025-08-29 00:59:54
268
原创 【AI应用开发】RAG系列(3)——如何衡量两个向量是否相似
摘要: 向量数据库通过嵌入模型将文本转换为高维向量,使语义相似性转化为几何距离问题。相似性搜索通过计算向量间的余弦相似度或欧氏距离来衡量,其中余弦相似度因忽略向量长度而更适用于文本。为提升效率,采用近似最近邻(ANN)算法如HNSW、LSH等替代暴力搜索,快速定位相似向量。整个过程包括向量化、索引构建和高效查询,支撑了RAG等应用的高效检索能力。(149字)
2025-08-29 00:53:25
367
原创 【AI应用开发】RAG系列(1)——RAG是什么
RAG(检索增强生成)是一种提升大语言模型性能的架构模式,通过检索外部知识库获取相关信息,再结合原始问题生成更准确的答案。它解决了LLM的知识滞后、幻觉和缺乏领域知识等问题。工作流程分为检索和增强生成两个阶段:先将知识库内容向量化存储,检索相关文本后构建增强提示,再由大模型生成可靠答案。RAG的优势包括提高准确性、实时更新知识、降低成本、增强可信度和处理私有数据。这一模式为智能客服、文档问答等企业级AI应用提供了有效解决方案。
2025-08-29 00:36:06
70
原创 【DeepSeek-R1 】分词系统架构解析
DeepSeek-R1 分词系统解析 DeepSeek-R1 采用 SentencePiece Unigram 算法,通过统计语言模型实现高效子词分词。其核心优势包括: 算法对比:相比 BPE/WordPiece,Unigram 基于概率模型,支持多语言,自动回退字符级处理。 特性优化:智能空格处理、数字分桶、多语言统一支持,并采用前缀树索引和 SIMD 并行加速,编码速度达 12,458 tok/s。
2025-08-02 19:33:29
320
原创 【LLaMA Factory】LoRA微调显存优化权威指南
本文深入解析了LLaMA Factory中LoRA微调的显存优化策略。针对大模型微调面临的显存黑洞、资源浪费等痛点,提出了四维优化体系,包括精确显存估算、梯度检查点、混合精度训练和QLoRA量化。通过技术原理剖析和实战演示,给出了7B模型在消费级显卡上的显存估算公式(总显存≈模型权重+优化器+梯度+激活值+框架开销)和优化配置方案。测试数据显示,QLoRA+梯度检查点组合可将7B模型的显存需求从15.6GB降至5.1GB,仅损失1%精度。文章为开发者在有限硬件资源下高效微调大模型提供了实用指南。
2025-07-30 18:01:08
1290
原创 【LangGraph技术深度解析】构建下一代AI工作流的革命性框架
LangGraph是LangChain生态中的有状态工作流引擎,专为构建复杂AI应用设计。它解决了传统AI开发中的状态混乱、并发缺失、错误恢复难等痛点,通过状态图、节点并发、条件路由和持久化检查点等机制提升效率。相比Airflow等工具,LangGraph在LLM集成、动态路由和开发速度上优势明显。 实战演示展示了智能客服工单路由系统和多Agent协作写作系统的实现,包括状态容器定义、节点创建、条件路由设置等关键步骤。
2025-07-30 17:54:55
1090
原创 【islice深度解析】高效处理大型数据的迭代器切片神器
本文全面剖析Python标准库中`itertools.islice`的核心原理与应用场景,通过多个实战案例展示其如何高效处理大型数据集、文件流和无限序列,并提供性能优化策略与最佳实践方案。
2025-07-27 17:34:49
893
原创 【RAG技术权威指南】从原理到企业级应用实践
本文系统介绍了检索增强生成(RAG)技术,通过融合实时检索与语言模型生成,有效解决大模型知识固化、幻觉等问题。文章包含RAG核心架构解析(检索-增强-生成三阶段)、关键模块对比(向量检索、提示工程等)、两种代码实现案例(基础流程与混合检索),以及性能测试数据(准确率提升35%,幻觉率降低84%)。最后提出分块优化、重排序等最佳实践方案,为AI工程师提供从原理到落地的完整技术指南。
2025-07-27 17:32:06
1030
原创 【 Python 】Collections库权威指南
Python的collections模块扩展了内置容器类型,提供了更高效专业的数据结构。主要内容包括: Counter - 高效统计元素出现次数,支持数学运算和频率统计 defaultdict - 自动初始化字典,避免键不存在错误 deque - 双端队列,支持高效的头尾操作和固定长度窗口 namedtuple - 创建带字段名的轻量级对象,支持默认值和方法扩展 OrderedDict - 有序字典(Python 3.7+中普通字典已有序) 这些数据结构能显著提升代码效率,解决原生容器的局限性。
2025-07-27 17:24:40
111
原创 【思维链(CoT)技术深度解析】从理论到实践的革命性推理方法
摘要:思维链(CoT)技术解析与实践 本文系统介绍了思维链(Chain-of-Thought)技术的原理与应用。作为AI推理领域的突破性进展,CoT通过分步引导、显式推理等机制,显著提升大语言模型在复杂任务中的表现。文章详细解析了CoT的核心原理,包括问题拆解、思维可视化等关键功能,并对比了传统提示与进阶CoT的技术差异。实践部分提供了基础CoT提示和自我一致性CoT的代码实现,通过数学问题验证其有效性。测试数据显示,CoT使GPT-3.5准确率提升52%,GPT-4接近人类水平。最后给出了问题分解模板和混
2025-07-27 14:33:56
1031
原创 【ChatOpenAI】常用方法详解
本文详细介绍了LangChain中ChatOpenAI类的核心功能和使用方法。主要内容包括:同步调用的invoke()、流式响应的stream()、批量处理的generate()方法;高级功能如工具绑定的bind_tools()、结构化输出的with_structured_output();以及模型配置、异步调用等实用技巧。文章提供了完整的代码示例和工作流,涵盖了从基础对话到复杂交互的各种场景,并分享了温度设置、错误处理等最佳实践,帮助开发者高效使用OpenAI聊天模型。
2025-07-19 23:23:25
815
原创 【报错】sqlite3.ProgrammingError: Incorrect number of bindings supplied. The current statement uses 1, a
SQLite参数绑定错误摘要(150字): 当使用SQLite执行带参数的SQL语句时,若参数数量与占位符?数量不匹配会报错Incorrect number of bindings supplied。常见错误包括:直接传入字符串而非元组、参数数量多于占位符数量。正确做法是始终用元组传参,即使单个参数也要写成(value,)形式。例如查询用户时应使用cursor.execute("...WHERE username=?", (name,))而非直接传入字符串。在调试时可打印参数类型和值,确
2025-07-17 22:39:11
276
原创 【Python进阶】深度复制——deepcopy
在Python中,可深度复制的对象包括基本数据类型(整数、浮点数、布尔值、字符串)、标准容器(列表、字典、元组、集合)以及满足条件的自定义类。深度复制会创建完全独立的新对象,递归复制所有嵌套内容。不可深度复制的对象包括外部资源句柄、线程/进程对象、数据库连接和模块等。深度复制比浅层复制更彻底但更耗资源,适用于需要完全独立副本的场景。自定义类可通过实现__deepcopy__方法来支持深度复制。使用时需注意处理不可复制对象和循环引用问题,合理选择复制方式以提高效率。
2025-07-14 22:32:57
448
原创 【Gradio= 5.36.2】前端加载空白故障深度排查与解决方案
本文全面解析Gradio 5.36.2版本的前端加载故障现象,通过浏览器控制台错误分析、版本对比测试和解决方案验证,提供完整的问题排查路径和修复方案。
2025-07-14 00:41:52
1871
原创 【模型部署】如何在Linux中通过脚本文件部署模型
本文介绍了在Linux系统中部署vLLM API服务器的五种实用方法:1) Shell脚本快速部署;2) Systemd服务实现生产环境高可用;3) Python脚本灵活控制;4) Makefile管理复杂流程;5) Docker容器确保环境隔离。针对不同场景推荐对应方案:测试用Shell脚本、生产用Systemd、复杂逻辑用Python脚本、团队协作用Docker。所有方法均包含详细配置步骤和权限设置说明,并强调路径可访问性及环境隔离的重要性,实现一键式部署调用。
2025-06-29 15:35:10
1099
原创 【Python进阶】元类编程
本文系统剖析Python元类的核心原理,通过ORM框架、单例模式、动态校验等8个实战案例,揭示元类在框架开发中的高阶应用,并结合性能优化与设计哲学探讨其工程实践价值。
2025-06-03 23:24:26
1638
1
原创 【Python进阶】装饰器
本文系统讲解Python装饰器的核心原理、实现机制和工程实践,涵盖函数装饰器、类装饰器、参数化装饰器等高级用法,提供20+实战案例和性能优化方案。
2025-06-03 21:58:37
868
原创 【Vue 3全栈实战】从组合式API到企业级架构设计
本文通过18个企业级案例,深度解析Vue 3核心特性与工程化实践,涵盖Composition API、Pinia状态管理、性能优化等关键技术,提供可落地的架构方案和最佳实践指南。
2025-06-01 23:56:26
1898
原创 【Python进阶】CPython
本文深入剖析CPython的核心架构与运行机制,通过实战案例揭秘解释器工作原理、内存管理、GIL机制等关键技术,帮助开发者深入理解Python底层实现并提升性能优化能力。
2025-05-31 23:38:01
432
原创 【Python高阶】面向对象
本文系统讲解Python中阶开发的8大核心技能,通过实战案例揭秘面向对象设计、并发编程、模块化开发等关键技术,帮助开发者从基础迈向专业级Python开发。
2025-05-31 23:34:39
403
原创 【Python进阶】元编程、并发
本文深入解析Python高阶编程的七大核心技术领域,通过企业级案例揭秘元编程、并发模型、性能优化等高级主题,帮助开发者突破Python技能瓶颈。
2025-05-31 23:30:03
272
原创 【Python】os模块
本文系统解析Python os模块的多个功能方法,通过企业级案例展示文件操作、路径管理、进程控制等核心技术,提供跨平台开发的最佳实践与性能优化方案。
2025-05-30 23:52:47
1687
3
原创 【LangChain】
本文深度剖析LangChain框架的四大核心组件(Libraries/Templates/Serve/Smith),通过12个企业级案例展示如何构建、优化和部署生产级LLM应用,提供端到端的开发解决方案。
2025-05-30 23:28:09
1228
原创 【LangChain】框架解析
本文系统解析LangChain框架的核心组件与技术架构,通过实战案例展示其在企业级LLM应用开发中的完整工作流,涵盖模型集成、链式编排、API部署等关键环节。
2025-05-30 00:01:41
1003
原创 【LangChain】
Chains 组合多个步骤(如:问答=检索+生成) RetrievalQA.from_chain_type(llm, retriever=vectorstore.as_retriever())Agents 让LLM动态调用工具(搜索引擎/计算器等) initialize_agent(tools, llm, agent=“zero-shot-react-description”)add_routes(app, chain, path=“/chat”) # 自动生成POST接口。
2025-05-29 23:57:39
412
原创 【多智能体系统开发框架AutoGen解析与实践】
本文系统探讨微软AutoGen框架的技术原理与应用实践,通过企业级案例展示其在复杂任务协调、多智能体协作等场景的实现方案,提供架构设计与性能优化建议。
2025-05-26 23:53:58
1358
原创 【LangChain表达式语言(LCEL)应用实践】
本文面向开发者介绍LangChain表达式语言(LCEL)的技术实现与工程实践,通过基础组件搭建、流程编排和性能调优等环节,展示如何构建可维护的大语言模型应用。
2025-05-26 23:45:58
1020
原创 【LCEL深度解析】LangChain表达式语言的工程化实践指南
本文通过多个企业级案例,系统讲解LCEL(LangChain Expression Language)的核心原理与高阶用法,揭示如何通过声明式语法构建高效可靠的LLM应用流水线。
2025-05-25 23:44:11
1309
原创 【LangChain全栈开发指南】从LLM应用到企业级AI助手构建
本文通过15个企业级案例,深度解析LangChain框架的核心模块与高阶用法,涵盖模型集成、数据检索、工作流编排等关键技术,提供可落地的AI应用开发方案。
2025-05-25 23:29:40
1357
原创 【RAG文档切割】从基础拆分到语义分块实战指南
本文系统讲解RAG系统中的文档切割技术,通过10+个典型场景案例,展示文本分块策略对检索质量的影响,提供工业级分块方案与评估指标。
2025-05-24 23:19:28
1407
原创 【检索增强生成(RAG)全解析】从理论到工业级实践
本文深入剖析RAG技术原理,通过企业级应用案例展示检索增强生成在问答系统、知识管理等领域的关键实现,提供性能优化方案与架构设计指南。
2025-05-24 23:17:48
1619
原创 【Python正则表达式终极指南】从零到工程级实战
本文通过10+个真实场景案例,深度解析Python re模块的核心技术与高级技巧,涵盖模式匹配、文本提取、数据清洗等关键领域,提供可复用的正则模板与性能优化方案。
2025-05-23 23:06:15
1279
原创 【 正则表达式】文本处理的终极利器 - 从模式匹配到工程实践
本文通过多个典型场景案例,系统剖析正则表达式在数据清洗、日志分析、表单验证等领域的深度应用,提供从基础语法到性能优化的全栈解决方案。
2025-05-23 23:04:25
120
原创 【Python数据库全栈指南】从SQL到ORM深度实践
本文通过8个企业级案例,系统讲解Python操作SQLite、MySQL、PostgreSQL等数据库的核心技术,涵盖原生SQL、ORM框架、性能优化等场景,提供完整的数据库工程化解决方案。
2025-05-23 11:00:15
1257
原创 【Tkinter从入门到精通】Python原生GUI开发全指南
本文通过6个实战案例,系统讲解Tkinter的核心组件、布局管理、事件处理等关键技术,涵盖基础控件使用到复杂应用开发,助你快速构建跨平台桌面应用。
2025-05-23 10:59:51
1295
原创 【Python GUI框架全解析】六大主流工具对比与实战指南
本文横向对比PyQt、wxPython、Kivy等六大Python GUI框架,通过8个代码案例展示核心用法,帮助开发者根据项目需求选择最佳解决方案。
2025-05-22 23:55:18
3134
原创 【Python中的Socket套接字详解】网络通信的核心基石
本文深入讲解Socket套接字的核心概念、工作原理及Python实现方式,通过3个代码案例演示基础通信流程,助你快速掌握网络编程的核心工具。
2025-05-22 23:53:06
1130
原创 【Python socket模块深度解析】网络通信的核心工具
本文将全面剖析Python标准库中的`socket`模块,详解其核心API、TCP/UDP编程实现及最佳实践,助你从零掌握网络通信底层原理。
2025-05-22 23:51:27
940
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅