- 博客(47)
- 资源 (10)
- 收藏
- 关注
原创 LLaMA-Factory 快速入门:手把手教你微调大模型
LLaMA-Factory是一款开源大语言模型微调框架,支持LLaMA、ChatGLM等模型的快速适配。它提供全量微调、LoRA等多种方式,简化了模型定制过程。使用步骤包括:安装依赖、准备模型与数据(支持Alpaca等格式)、启动微调(可通过命令行或WebUI)、推理部署(支持Gradio交互)。关键功能包括:降低显存消耗(混合精度训练)、多GPU加速、数据增强。典型应用包括客服机器人、文案生成和代码辅助等。该框架显著降低了模型定制门槛,让开发者能快速构建专用AI应用。
2025-06-05 16:52:52
281
原创 pip命令:从基础到进阶的完整指南
本文详细介绍了Python包管理工具pip的各类操作和实用技巧。主要内容包括:1)基础功能如安装、升级、卸载和依赖管理;2)进阶操作如镜像源加速、虚拟环境配置和依赖冲突诊断;3)高级功能涉及包开发分发和安全审计;4)典型问题解决方案包括版本冲突处理和离线部署;5)性能优化建议如并行安装和缓存控制。通过系统掌握这些命令和策略,开发者能够高效管理Python项目依赖,提升开发效率。
2025-06-05 15:57:39
478
原创 LLaMA-Factory和python版本的兼容性问题解决
LLaMA-Factory的模型微调工具,在版本 LLaMA Factory, version 0.9.3.dev0,至少还是需要python3.10的,高版本的可能面临版本冲突导致无法正常安装。根据llamafactory-cli.exe version 验证命令和git版本管理的的追溯,可以看到本次安装的LLaMA-Factory的tag版本。从日志中看到,当前安装时候用的python版本是python3.13,按照分析的思路,先更换成python3.10再次运行,成功安装。
2025-06-05 12:14:09
248
原创 Vite实战指南
本文介绍了Vite前端构建工具的快速安装与使用指南。Vite基于ES模块导入,提供毫秒级冷启动和实时热更新。主要内容包括:1)环境准备(安装Node.js及配置npm);2)创建Vite项目(支持Vue/React等模板);3)启动开发服务器;4)生产环境构建;5)核心配置(端口/代理等);6)插件集成;7)常见问题解决;8)Vite优势分析。通过简洁步骤帮助开发者在Windows系统快速上手Vite开发,提升前端构建效率。
2025-06-04 18:52:05
402
原创 Anaconda全平台安装指南
【摘要】Anaconda作为主流数据科学平台,本教程详细介绍了其跨平台安装方法。Windows用户需注意勾选PATH环境变量选项;macOS用户需通过终端运行安装脚本;Linux用户需手动配置PATH变量。安装后建议通过conda --version验证,并可配置清华镜像源加速下载。对于安装错误、路径配置等常见问题提供了解决方案,帮助用户快速搭建高效的数据分析环境。全文约150字,涵盖下载、安装、验证及配置全流程。
2025-06-04 15:05:41
628
原创 Java编程之建造者模式
摘要:建造者模式是一种创建型设计模式,用于分步构建复杂对象,将构建过程与表示分离。核心组件包括产品、抽象建造者、具体建造者和指挥者。通过电脑配置示例展示了如何实现该模式,包括产品类定义、建造者内部类和使用链式调用的对象构建过程。该模式的优点包括构建表示分离、分步构建、链式调用和参数验证,适用于创建复杂对象、处理多可选参数及构建不同产品表示的场景。与工厂模式相比,建造者模式更关注对象的分步构建过程。实际开发中可用Lombok的@Builder注解简化代码编写。
2025-06-03 17:44:10
432
原创 RAG架构中用到的模型学习思考
RAG架构中用到的模型主要包括Embedding模型、LLM模型和可选的Reranker模型。我们在选择模型时,应根据自身需求、场景特点和计算资源进行综合考虑。通过合理选择和集成模型,我们可以构建出高效、准确的RAG系统,提升知识检索和生成的效率和质量。
2025-06-03 16:13:25
770
原创 Dify在Windows 11上的安装实战
《Dify在Windows 11上的安装实战》摘要本文详细介绍了Dify在Windows 11上的安装流程。安装前需确认系统满足要求,启用WSL 2与虚拟机平台,安装Git与Docker Desktop并配置镜像加速。安装时,克隆Dify源代码,配置环境变量,用Docker Compose启动服务并验证。还针对端口冲突、数据库连接错误等常见问题给出解决方案,并介绍了接入本地Ollama模型、使用硅基流动代理模型以及自定义数据集与知识库等高级配置,助力读者在Windows 11上成功开启Dify应用开发。
2025-06-02 16:04:22
1156
原创 在本地基于deepseek和Dify平台构建私有化知识库平台
本文介绍了基于DeepSeek-R1大模型和Dify平台快速构建私有知识库问答系统的方法。首先详细说明了DeepSeek-R1和Dify的技术优势及部署方式,包括Docker和本地Python环境两种部署方案。其次指导了知识库的创建与配置流程,包括数据准备、模型连接和应用设置。最后提供了测试优化建议和完整的脚本示例,展示了一个可离线运行、数据安全且支持动态更新的智能问答系统解决方案。该系统具有低成本、易扩展的特点,适合企业和个人管理私有知识的需求。
2025-06-02 10:58:42
889
原创 Java抽象工厂模式详解
Java抽象工厂模式是一种创建型设计模式,用于封装一组相关产品的创建过程。该模式通过抽象工厂接口定义产品创建方法,由具体工厂实现类负责创建特定系列的产品(如Windows/MacOS风格的UI组件)。主要包含四个角色:抽象工厂、具体工厂、抽象产品和具体产品。其优点包括解耦客户端代码、保证产品一致性,但扩展新产品类型时需要修改接口。适用于需要创建多系列相关产品的场景,如跨平台UI组件开发。相比于工厂方法模式,抽象工厂能处理更复杂的产品家族创建需求。
2025-06-01 22:10:56
1172
原创 认识GraphRAG
微软GraphRAG技术通过知识图谱增强大语言模型,突破传统RAG局限。其核心创新在于:1)构建知识图谱时提取实体、关系形成层次化社区结构;2)查询时通过社区匹配和多跳推理生成全局答案。相比传统RAG基于文本块匹配的局限性,GraphRAG擅长处理多跳推理、全局摘要和隐性关系挖掘,特别适合医疗、法律等专业领域。虽然面临成本挑战,但随着轻量化框架发展,GraphRAG有望成为企业知识系统的核心技术。
2025-06-01 08:35:40
428
原创 RAGflow详解及实战指南
《RAGflow:企业级检索增强生成引擎技术解析与实践指南》 摘要:RAGflow是一款开源企业级RAG引擎,通过融合多模态文档解析、混合检索与大语言模型生成能力,解决非结构化数据处理难题。其核心技术采用“检索+生成”双轮驱动模式,分层架构支持模块化扩展,具备90%+的复杂文档识别准确率和40%的响应速度提升。指南详细解析了其在知识库搭建、智能客服、金融分析、设备维保等场景的落地实践,并提供了本地部署流程与性能优化技巧(如动态分块策略、混合检索权重调优)。典型企业案例显示故障诊断准确率提升20%,报告生成效
2025-06-01 07:53:11
1144
原创 RAGFlow从理论到实战的检索增强生成指南
《RAGFlow:开源检索增强生成框架实战指南》摘要 RAGFlow是一款开源的企业级检索增强生成(RAG)框架,旨在解决大模型知识更新滞后和专业领域回答不准确的问题。该框架具备多模态解析能力,支持PDF/Word/图片等多种格式,通过深度语义检索和混合索引技术提升召回率。技术架构包含文档解析层、向量存储层、检索增强层和生成层。本文提供了从环境准备到数据接入、检索与生成的完整实战指南,并介绍了查询扩展、结果重排等优化技巧。评估指标包括召回率、准确率和延迟等。未来将向多模态融合、端到端优化等方向发展,成为企业
2025-05-31 20:36:48
585
原创 常见的RAG文档解析辅助工具汇总及企业选型思考
开源RAG工具汇总:RAGFlow支持23种格式解析和工业级部署(Apache-2.0);Chonkie提供多种文本切分方式;VARAG专注多模态检索;Kotaemon支持文档问答;Haystack为模块化框架(Apache-2.0);txtai实现语义搜索(Apache-2.0);QAnything为网易开源项目;ragflow-upload辅助批量上传(MIT);UnstructuredPaddleOCR支持多语言OCR。企业级推荐RAGFlow/Haystack,轻量级可选Chonkie/txtai,
2025-05-31 20:25:21
1066
原创 23种设计模式概览
设计模式分创建型、结构型、行为型三类。创建型优化对象创建,如单例、工厂模式;结构型构建高效结构,如适配器、装饰器模式;行为型增强对象协作,如观察者、策略模式。这些模式通过封装变化、提高复用,显著提升代码的可读性、可维护性和可扩展性,是软件设计的经典解决方案。
2025-05-31 16:56:47
835
原创 Java工厂方法模式详解
《工厂方法模式解析》 工厂方法模式是一种创建型设计模式,核心是将对象创建与使用分离。通过定义创建接口并让子类决定实例化哪个类,提升了代码扩展性和维护性。模式包含四个要素:产品接口、具体产品类、工厂抽象类和具体工厂实现类。相比简单工厂违反开闭原则的缺点,标准工厂方法模式通过继承和多态将创建逻辑延迟到子类。常见变体包括参数化工厂和反射工厂两种实现方式。该模式特别适合对象创建复杂、需要动态生成或框架设计的场景。虽然会增加类数量,但遵循开闭原则、降低耦合度的优势使其成为最常用的设计模式之一。与简单工厂和抽象工厂相比
2025-05-31 16:49:51
550
原创 Java 单例模式详解
摘要:Java单例模式确保类仅有一个实例并提供全局访问点。主要实现方式包括:1)饿汉式(线程安全但资源浪费);2)懒汉式(非线程安全);3)同步锁懒汉式(线程安全但性能差);4)双重检查锁(线程安全且高效,需volatile);5)静态内部类(推荐方案,延迟加载且线程安全);6)枚举(最佳实践,防序列化和反射攻击)。单例模式适用于资源管理、配置管理等场景,但需注意序列化时需实现readResolve()方法。推荐优先采用静态内部类或枚举实现,避免基本懒汉式在多线程环境下的安全问题。
2025-05-31 13:07:11
495
原创 企业应用AI对向量数据库选型思考
本文深入探讨了向量数据库的分类与企业选型策略。向量数据库主要分为开源与商业、原生与扩展、本地部署与云托管三类。企业在选型时需综合考量数据规模、性能要求、预算限制、技术栈兼容性及功能需求。针对不同行业,互联网企业可优先选择分布式原生或商业托管数据库;金融机构应考虑数据安全性高的传统数据库加向量扩展方案;科研机构需关注性能卓越的数据库如 Milvus 和 FAISS;创业公司则可借助开源数据库及云免费资源实现快速验证。实施选型时,企业应遵循明确业务需求,评估技术能力,进行 POC 测试,综合评估方案以便实施。
2025-05-30 22:23:35
731
原创 深入了解MCP基础与架构
摘要: MCP(Model Communication Protocol)是新一代AI交互标准协议,旨在解决大语言模型(LLM)与物理世界系统间的兼容性问题。传统AI集成方案(如API直连、微服务改造)存在数据隐私风险、改造成本高和实时性差等缺陷,而MCP通过标准化接口、上下文全生命周期管理和安全沙箱机制,实现了开发效率提升(减少70%样板代码)、运行成本优化(响应时间降低85%)与安全合规保障。其三层架构(Host-Client-Server)支持双向通信、智能路由和动态权限控制,已在智能供应链、医疗诊断
2025-05-30 12:23:54
1712
原创 大模型深度学习之双塔模型
双塔模型(Two-Tower Model)是一种在推荐系统、信息检索和自然语言处理等领域广泛应用的深度学习架构。其核心思想是通过两个独立的神经网络(用户塔和物品塔)分别处理用户和物品的特征,并在共享的语义空间中通过相似度计算实现匹配或召回任务。本文从该模型的各个维度开始,对模型做通俗易懂的说明。让您轻松理解这一在推荐系统、信息检索和自然语言处理等领域广泛应用的深度在这里插入图片描述学习架构。一、双塔模型初印象:就像搭积木想象一下,您正在玩搭积木的游戏。
2025-05-29 20:55:10
1170
原创 一文理清楚大模型里的RAG架构
RAG(检索增强生成)技术通过结合信息检索与生成模型的优势,有效解决了大模型在知识密集型任务中的局限性。其核心包括检索模块、增强模块和生成模块三个组件,工作流程涵盖离线数据处理和在线检索两个阶段。关键技术涉及向量化、双塔模型架构、高效检索算法和提示构建策略。RAG具有提高回答准确性、实时更新知识等优势,但也面临检索准确性、资源需求高等挑战。该技术在问答系统、内容创作等领域有广泛应用前景,未来将随着技术进步而更加成熟。
2025-05-29 15:40:04
908
原创 Windows 11 安装 Miniconda 与 Jupyter 全流程指南
conda create -n jupyter_env python=3.10 # 创建名为 jupyter_env 的 Python 3.10 环境。conda env remove --prefix="C:\Users\opfly\.conda\envs\jupyter_env" #移除环境。conda install -c conda-forge jupyter_contrib_nbextensions # 代码折叠、目录生成等。conda --version # 显示版本号即成功。
2025-05-28 17:43:58
700
原创 Windows系统上Python如何升级及版本管理
本文介绍了在Windows系统下将Python 3.11升级到3.12的详细步骤。首先建议确认当前版本并备份项目数据,然后提供三种升级方式:官方安装程序(推荐)、命令行pip升级(适合高级用户)和conda升级(适合虚拟环境)。文中还包含旧版本卸载指南、环境变量清理方法,以及多版本共存管理技巧。操作过程强调路径配置、依赖备份和环境验证,确保升级过程安全可控,最后建议在非生产环境充分测试后再正式迁移。
2025-05-28 15:46:35
517
原创 Jupyter Lab 使用从入门到精通:一站式数据科学与开发环境指南
本文全面介绍JupyterLab,一个基于Web的交互式开发环境。主要内容包括:1)基础安装配置方法;2)核心功能如数据处理、可视化、机器学习的应用;3)丰富的插件生态系统,涵盖代码增强、版本控制、AI辅助等;4)高级配置包括远程访问、扩展开发和性能优化;5)前沿功能如实时协作和GPU加速。JupyterLab凭借模块化设计、多语言支持和强大的扩展能力,成为数据科学和开发领域的重要工具,文章还提供了学习资源和合规说明。
2025-05-27 18:31:01
1243
2
原创 Python开源库 Streamlit 详细介绍
Streamlit是一个开源的Python框架,帮助数据科学家快速构建交互式Web应用,无需掌握复杂的前端技术。文章详细介绍了Streamlit的安装方法、基础应用创建过程及运行机制,并深入解析其核心功能,包括文本展示、数据可视化、交互式组件(按钮、滑块等)、文件上传及布局设计。此外,还讲解了高级特性如状态管理、主题定制和机器学习模型集成。文章还提供了多种部署选项(Streamlit社区云、Heroku等)和实际应用案例(数据分析、模型演示),最后展望了Streamlit的未来发展,强调其在数据科学领域的价
2025-05-27 10:57:19
1236
原创 node.js-入门篇(基础介绍)
本篇章假设对node已经有一定的了解,掌握nvm,yarn等基础命令,掌握git版本管理。如果不明白,可以提前了解。不仅可以使用官方提供的模块快速开发,也可以自己根据实际情况,封装自己的模块进行使用,比如:文件一:hello.js 封装模块,module.exports来发布模块文件二:test.js。
2024-05-26 18:12:37
810
原创 常见的网络协议及划分标准
本文系统介绍了网络协议的分类、功能及工作机制。主要内容包括:1)协议分类与功能,涵盖应用层(HTTP、FTP等)、传输层(TCP/UDP)、网络层(IP)等各层核心协议;2)OSI七层与TCP/IP四层模型划分标准;3)关键协议对比(TCP/UDP、HTTP/HTTPS、IPv4/IPv6);4)具体工作机制示例(TCP三次握手、DNS查询、DHCP流程)。文章强调理解网络协议对优化网络性能、保障数据安全的重要性,指出应根据不同应用场景选择合适的通信协议。(149字)
2022-11-06 19:14:00
640
2
原创 保留最近30填内的压缩数据脚本
这是一个用于清理旧压缩文件的Linux脚本,主要功能是删除指定目录中超过30天的压缩文件(如.gz、.zip、.tar.gz等)。脚本提供安全检查和彩色输出,支持测试模式(仅显示不删除)。使用时需配置目标目录、文件扩展名和保留天数。特性包括递归处理子目录、精确计算文件时长、统计释放空间量等。首次运行建议保持测试模式验证结果,确认无误后再启用实际删除功能。可通过cron设置定期自动清理,适用于需要管理存储空间的场景。
2022-06-01 14:19:13
118
原创 jenkins安装及常见错误排查
目录下载jenkins配置java环境关闭防火墙修改jenkin配置文件下载jenkins获取jenkins连接,笔者用的是centos,从国内开源代理网站获取,没有从jenkins逛网拿。wget -O jenkins-2.319.3-1.1.noarch.rpm https://mirrors.tuna.tsinghua.edu.cn/jenkins/redhat-stable/jenkins-2.319.3-1.1.noarch.rpm --no-check.
2022-03-02 13:54:50
5229
2
原创 如何给已有的逻辑卷磁盘扩容
1. 增加磁盘scsi,20G,reboot.2. fdisk -l查看 并分区fdisk /dev/sdb 8e3. 创建物理卷pvcreate. vgs,lvs,pvs查看一波。4. 扩卷组 vgextend centos /dev/sdb1 centos为原有的卷组。5. 扩逻辑卷 lvextend -l 100%FREE /dev/mapper/centos-var6. 写入磁盘xfs_growfs /dev/mapper/centos-var7. df -hT查看增加的卷。
2022-03-01 16:39:13
5979
2
原创 【无标题】Cannot connect to VMcom.sun.jdi.connect.TransportTimeoutException解决办法
-agentpath=E:\software\eclipse\eclipse202009\pool\plugins\org.zeroturnaround.eclipse.embedder_2020.3.2.RELEASE\jrebel\lib\jrebel64.dll改为:-agentpath:E:\software\eclipse\eclipse202009\pool\plugins\org.zeroturnaround.eclipse.embedder_2020.3.2.RELEASE\...
2022-02-04 13:26:27
1217
【Python数据科学】Streamlit开源库全面解析:从入门到高级应用及部署方案
2025-05-29
早期struts1、ibatis、hibernate相关包
2021-11-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人