- 博客(437)
- 收藏
- 关注
原创 Windows 系统安装 Composer 详细教程
Composer 是 PHP 的依赖管理工具,类似于 Node.js 的 npm 或 Python 的 pip。本教程将详细介绍在 Windows 系统上安装 Composer 的完整步骤。通过以上步骤,你已经在 Windows 系统上成功安装了 Composer 并配置了国内镜像。现在你可以使用 Composer 来管理 PHP 项目的依赖了。PHP 是否正确安装并配置环境变量是否设置正确防火墙或安全软件是否阻止了下载。
2025-11-06 21:34:23
597
原创 Apache Pulsar 快速入门指南:从安装到Python消息收发全流程
Apache Pulsar是一个企业级的分布式发布-订阅消息系统,具有高性能、可扩展性和易用性等特点。本文将带你从零开始,在Ubuntu服务器上完成Pulsar的安装、配置,并使用Python实现消息的生产和消费。在Ubuntu服务器上安装和配置Pulsar启动Pulsar单机模式服务使用Python创建Pulsar生产者和消费者实现消息的发送和接收排查常见问题Pulsar提供了强大的消息传递能力,适用于各种实时数据处理场景。
2025-11-03 11:28:21
646
原创 在Ubuntu云服务器上安装宝塔面板的完整指南
本文详细介绍了在Ubuntu云服务器上安装宝塔面板的全过程,包括环境准备、安装步骤、关键配置及常见问题解决方案。主要内容涵盖:使用SSH连接服务器并更新系统包;提供三种安装脚本选择;配置安全组和防火墙放行端口;首次登录后的初始化设置;针对安装失败、无法访问等常见问题的排查方法;以及安装后的安全建议(修改默认密码、端口和安全入口)。文章还介绍了性能优化、计划任务设置等进阶配置,帮助用户快速掌握宝塔面板的使用,降低服务器管理技术门槛。
2025-10-31 18:03:21
1035
原创 微信自动化必备软件:inspect(获取微信界面元素)
SaveButton10015.2:1 ✅(合格)Passed ✅说明这个控件完全符合无障碍标准。
2025-10-31 14:57:44
572
原创 Gitee仓库清理指南:如何移除误传的无关文件并正确使用.gitignore
本文介绍了如何清理Git仓库中误提交的无关文件(如node_modules、系统文件等)并建立规范工作流程。首先通过git rm -r --cached命令移除已跟踪文件,然后创建详细的.gitignore文件配置忽略规则,最后重新提交。文章强调应在项目初始化时即配置.gitignore,并提供了常见开发环境的配置模板。最佳实践包括将.gitignore纳入版本控制、理解模式匹配规则以及处理需要保留的空目录等特殊情况。通过这三个步骤,可以彻底清理仓库并预防未来出现类似问题。
2025-10-27 16:55:11
930
原创 pytest从入门到进阶:高效编写Python测试的完整指南
简单易用:入门简单,文档丰富,有很多实例可以参考功能全面:能够支持简单的单元测试和复杂的功能测试插件丰富:具有很多第三方插件,并且可以自定义扩展参数化测试:支持使用不同输入数据运行相同测试逻辑灵活的测试执行:可选择性执行部分测试用例,支持失败重试报告生成:可生成多种格式的测试报告,并方便与持续集成工具集成pytest是一个功能强大且灵活的Python测试框架,通过简单的入门学习和逐步深入的高级功能掌握,你可以显著提升测试代码的质量和开发效率。
2025-10-24 13:34:02
78
原创 UV包管理工具:重塑Python项目快速架构之道
uv是一个用Rust编写的超高速Python包管理器和解析器,旨在成为Python生态系统中一个统一、高效的工具链解决方案。它的目标十分宏大——用一个工具替代我们日常开发中的多件套:pip(包安装)、virtualenv(虚拟环境)、poetry(项目管理)、pipx(工具安装)、pyenv(Python版本管理)等。uv不仅仅是pip的更快替代品,它代表了Python包管理的未来发展方向——一体化、高性能、开发者友好。
2025-10-24 11:34:32
195
1
原创 Git 提交消息规范:理解 fix、feature 等关键词的含义
本文介绍了Git提交消息规范,重点解析fix和feat等核心关键词的含义与使用场景。提交消息应包含类型、描述和可选范围,采用特定格式以便自动化生成变更日志和版本号。文档还列举了docs、style等其他常用关键词,并提供了格式规范、最佳实践示例,以及它们与语义化版本的关联关系。最后推荐了Commitizen等工具支持,强调规范的提交消息对团队协作、项目维护的重要作用,建议团队在项目初期就建立并遵守相关规范。
2025-10-17 15:56:22
1018
原创 免登录 Git 远程仓库:SSH 密钥对配置完整指南
在使用 Git 进行版本控制时,每次推送代码都需要输入用户名和密码会严重影响工作效率。通过配置 SSH 密钥对,可以实现免密码认证,让 Git 操作更加便捷安全。
2025-10-16 15:01:43
1071
原创 使用VSCode SSH插件实现免密码登录远程服务器
本文介绍了如何通过配置SSH密钥实现VSCode一键连接远程服务器。首先在本地生成RSA密钥对,然后配置SSH客户端并上传公钥到服务器,最后在VSCode中安装Remote-SSH扩展完成连接。该方法不仅免去了频繁输入密码的麻烦,还提高了安全性。文中详细说明了各步骤操作命令、权限设置及故障排除方法,帮助开发者快速实现高效安全的远程开发环境搭建。
2025-10-16 14:53:58
445
原创 Ubuntu Linux 服务器快速安装 Docker 指南
本文详细介绍在Ubuntu系统上安装Docker的完整流程,重点针对国内网络环境进行优化。主要内容包括:系统准备(版本检查、旧版本卸载)、两种安装方法(官方源和国内镜像源)、安装后配置(服务启动、非root权限设置、镜像加速器配置)以及常见问题解决方案。特别提供了清华大学和阿里云等国内镜像源的配置方法,并包含网络超时、GPG密钥错误等常见问题的排查方法。最后还介绍了Portainer可视化管理工具的安装方式,帮助用户快速搭建高效的Docker环境。
2025-10-14 17:09:52
580
原创 突破NER性能瓶颈:BERT与LLM协同的混合架构实践
性能卓越:在多个测试集上,F1分数比单一模型提升5-15%成本可控:相比纯LLM方案,成本降低60%以上易于落地:架构清晰,便于调试和优化这种"专才+通才"的组合思路可以扩展到其他NLP任务中,如关系抽取、事件提取、文本分类等。更精细的流水线优化多模型投票机制在线学习与自适应调整不追求单一模型的万能,而是通过精心设计的组合,让每个组件发挥其独特优势,最终实现系统性能的最优化。欢迎在评论区分享你在NER任务中的实践经验,或者对这个混合架构的改进建议!
2025-09-29 18:54:33
865
原创 从绝对路径到相对路径:Python目录操作的四种优雅方式
本文介绍了四种将绝对路径转换为相对路径的Python方法:简单相对路径、os模块、pathlib和基于工作目录的方式。通过对比分析,推荐新项目优先使用pathlib,旧项目选择os模块,避免依赖工作目录。最佳实践包括在函数中接收路径参数、使用配置文件和考虑环境变量,以提高代码的可移植性和可维护性。根据项目需求选择合适方法,可写出更健壮的Python代码。
2025-09-29 10:20:31
898
原创 NLP算法岗位面试题分享:Zero-Shot、One-Shot与Few-Shot学习
Zero-Shot、One-Shot和Few-Shot学习代表了NLP模型从"记忆"到"理解"的重要转变。在面试中,不仅要展示技术深度,更要体现对实际业务场景的思考。通过系统掌握本文介绍的内容,你将能够在NLP算法岗位面试中脱颖而出。进一步学习资源Hugging Face的Few-Sh Learning教程希望这篇指南能为你的NLP算法工程师求职之路提供有力支持!
2025-09-28 18:00:19
1603
原创 Conda环境激活全指南:bash、conda activate与source activate详解
Conda环境管理指南摘要:Conda是开源的包和环境管理系统,支持创建独立Python环境避免依赖冲突。三种激活方法:推荐使用conda activate(跨平台通用),传统方式source activate(兼容老版本),以及通过新bash会话进入环境。常用命令包括环境查看、创建、删除和复制。遇到激活失败时可检查环境存在性或修复权限问题。最佳实践建议统一使用conda activate、规范命名并定期清理。典型应用场景展示了数据科学和Web开发项目的环境管理流程。掌握多种激活方法能提升开发效率,良好的环
2025-09-28 15:50:23
709
原创 如何配置Vite开发服务器实现局域网访问:两种方法详解
通过简单的配置,Vite开发服务器可以从仅限本地访问扩展到整个局域网,极大提升了开发测试的便利性。临时测试:使用方法一,快速修改package.json长期项目:使用方法二,一劳永逸配置vite.config.js这两种方案都能有效解决局域网访问问题,让你的前端开发 workflow 更加高效灵活。希望本文能帮助你顺利配置Vite开发服务器。如果你在实践过程中遇到其他问题,欢迎在评论区讨论交流!
2025-09-26 16:17:56
1144
原创 如何快速查找并解除端口占用:完整指南
本文总结了开发中常见的端口占用问题及解决方案。首先介绍如何通过系统命令(Windows的netstat/taskkill,Mac/Linux的lsof/kill)查找并终止占用端口的进程,包括详细命令示例。其次推荐了图形化工具和第三方工具的使用方法。针对前端项目,提供了预防端口冲突的配置建议和自动清理脚本。最后列举了权限不足、进程重启等常见问题的排查方法。文章强调掌握这些技巧能显著提升开发效率,并给出了常用开发端口的一键清理命令。
2025-09-26 16:11:42
1057
原创 如何快速将FastAPI 接口封装成StreamHTTP 接口()
FastMCP 是一个基于 Model Context Protocol (MCP) 的 Python 库,它允许开发者轻松地将现有的 FastAPI 应用转换为支持流式传输的 MCP 服务器。这对于需要实时数据流或长连接的应用场景非常有用。FastMCP 为 FastAPI 开发者提供了一个极其便捷的方式来添加流式 HTTP 支持。无论是用于实时数据推送、长轮询场景还是其他需要流式传输的应用,这个方案都能大大减少开发工作量。尝试使用 FastMCP,体验三行代码带来的强大功能提升吧!
2025-09-26 10:09:24
367
原创 知识检索中的四大评估指标:准确率、精确率、召回率与F1分数详解
摘要:NLP算法面试中,评估知识检索系统的核心指标包括准确率、精确率、召回率和F1分数。准确率衡量整体预测正确性,但在样本不均衡时可能失真;精确率关注预测正类中的真实比例(查准能力),召回率衡量真实正类被预测的比例(查全能力)。F1分数是两者的调和平均,提供综合评估。这些指标通过混淆矩阵计算,并存在制约关系:提高召回率往往降低精确率,反之亦然。应用场景包括文档检索(评估结果质量和覆盖度)和文本分类(如垃圾邮件过滤)。面试需掌握指标区别、适用场景及平衡方法(如调整阈值)。F1分数在样本不平衡时比准确率更具参考
2025-09-24 21:34:29
1322
原创 NLP算法岗位面试题精讲:深入理解LoRA与QLoRA
参考答案:全参数微调(Full Fine-Tuning)是指在下游任务训练时更新预训练模型的所有参数。局限性主要包括:· 内存开销巨大:需要存储模型权重、优化器状态、梯度等,显存需求是模型大小的3-4倍· 硬件门槛高:微调大型模型需要多GPU或高端显卡· 灾难性遗忘:可能过度适应新任务而丢失预训练获得的一般知识· 存储成本高:每个任务都需要保存完整的模型副本LoRA和QLoRA代表了大规模语言模型高效适配的重要技术路线。
2025-09-24 16:53:42
647
原创 理解NumPy高级索引:x = x[idx]的原理与应用
x = x[idx]是NumPy高级索引的一个典型应用,通过一个简单的操作实现了数据随机化,对于机器学习模型的训练至关重要。理解这一操作的工作原理有助于我们更好地处理数据,构建更稳健的机器学习流程。使用生成随机索引使用相同索引同时打乱特征和标签数据在每个训练周期开始时进行数据打乱注意内存使用和性能优化,特别是在处理大规模数据集时掌握了这一技术,你将能够更好地准备数据,为训练高性能的机器学习模型奠定坚实基础。
2025-09-19 16:06:52
229
原创 从数学到实践:详解 Sigmoid 函数的导数推导及其意义
y11e−xy1e−x1该函数将任意实数xxx映射到01(0, 1)01区间,常用于二分类问题的概率输出。Sigmoid 函数的导数为dydxy1−ydxdyy1−y,可通过链式法则和代数变换推导得出。用输出yyy表示导数(而非输入xxx)提高了计算效率、简化了实现,并增强了数值稳定性。理解这一推导过程有助于深入掌握神经网络中的梯度计算与反向传播机制。
2025-09-19 14:37:10
90
原创 理解全连接层与激活函数:以Sigmoid函数为例
在神经网络中,全连接层(Fully Connected Layer)是最基础的组件之一,但单纯的全连接层只能实现线性变换。这种变换是线性的——无论堆叠多少全连接层,最终等效于单个线性变换(因为线性变换的复合仍是线性的)。代码示例:可通过PyTorch/TensorFlow简单实验:对比使用/不使用Sigmoid的全连接网络在XOR等非线性问题上的表现差异,直观感受非线性激活函数的重要性。激活函数(Activation Function)作用于全连接层的输出,通过非线性函数对神经元输出进行变换。
2025-09-18 18:26:23
445
原创 理解神经网络中的批量数据处理:维度、矩阵乘法与广播机制
在神经网络中,数据通常被组织为(样本数量, 特征数量)**第0维度(行)**对应样本索引**第1维度(列)**对应特征索引这种设计结合矩阵运算和广播机制,使得我们能够高效地处理批量数据。理解这一概念是掌握深度学习实现细节的关键一步,它不仅适用于全连接层,也适用于卷积层、循环层等各种神经网络组件。下次当你看到x[0]表示第一个样本,h[3]表示第四个样本的隐藏表示时,你会明白这不仅仅是编码约定,而是高效计算的核心设计理念。
2025-09-18 17:34:58
86
原创 第一章 神经网络的复习:神经网络的推理
(mini-batch,小批量):以上讲解的都是单笔样本数据,如果同时对多笔样本数据进行推理和学习,就会将其保存在x的各行中。先设计一个输入二维数据、输出三维数据的函数。因此在输入层准备两个神经元,在输出层准备3个神经元,隐藏层放置若个神经元(这里放置了4个神经元)。,这个权重和对应神经元的值分别相乘,作为下一个神经元的输入。类似地,h[0] 是第 0 笔数据的隐藏层的神经元,h[1] 是第。此时,N 笔样本数据整体由全连接层进行变换,隐藏层的 N 个神经元被整。1 笔数据的隐藏层的神经元,以此类推。
2025-09-18 17:05:23
80
原创 神经网络绘图工具大集合:从简单到专业,总有一款适合你
神经网络可视化是深度学习研究和应用中不可或缺的一环。选择合适的绘图工具可以事半功倍,提高工作效率和成果展示质量。无论是初学者还是资深研究人员,都可以根据上述工具的特点选择最适合自己需求的方案。对于初学者,可以从NN-SVG或draw.io开始;对于专业研究者,PlotNeuralNet和Netron可能更为适用。希望本文整理的神经网络绘图工具集能对你的研究和学习有所帮助!如果你有更好的工具推荐,欢迎留言分享。🎨。
2025-09-18 10:57:34
1225
原创 向量内积在实际应用中的三大场景:从理论到实践
本文探讨了向量内积在三个实际场景中的应用,并提供了完整的Python实现代码。首先,在文档相似度计算中,通过TF-IDF向量化和余弦相似度衡量文本相似性;其次,在推荐系统中,利用用户-物品评分矩阵和向量内积实现个性化推荐;最后,在图像识别领域,通过深度学习模型提取特征向量并计算相似度。这些应用展示了向量内积在人工智能和数据分析中的核心作用,代码示例涵盖了中文分词、协同过滤和图像特征提取等关键技术,为相关领域提供了实用参考。
2025-09-17 16:47:04
102
原创 GitHub开源免费PDF编辑器推荐:告别破解,高效编辑PDF
PDF补丁丁是一款由国内开发者wmjordan开发的PDF工具箱,自2009年发布以来,已更新维护了12年。2021年12月,开发者正式将其开源,并采用了独特的“良心授权”协议:用户每次使用后如有所获益,应行一善事;如使用源代码开发新软件并获得收益,应将收益的千分之一捐赠给社会弱势群体。Stirling-PDF是一个基于Docker的本地化Web应用,提供了多达50多种PDF处理功能,被誉为“PDF的瑞士军刀”。
2025-09-17 15:45:50
3999
原创 理解向量内积的直观几何意义:为何它是“方向一致性”的完美度量?
本文深入解析向量内积的几何意义与应用。通过代数与几何双重视角,揭示内积本质是向量长度与夹角余弦的乘积,其值域[-1,1]精确量化了向量方向一致程度。几何上,内积可理解为向量投影的乘积,当向量归一化后直接等于cosθ。实际应用中,内积在余弦相似度、3D光照模型和物理功计算中发挥核心作用:在NLP中衡量文本相似性,在图形学中计算光照强度,在物理学中求解力做的功。理解内积的几何内涵,能有效提升对机器学习、计算机图形学等领域的认知深度。
2025-09-17 09:51:11
521
原创 MiniMind项目模型架构解析
MiniMind是一个轻量级语言模型项目,通过极简架构与创新设计,仅需3元成本和2小时训练即可实现高性能。其核心特点包括:基于Transformer的Decoder-only精简架构(最小25.8M参数)、全流程开源代码、支持混合专家(MoE)扩展,并优化硬件适配(单卡3090可训练)。关键技术突破包含极简词表设计(6400 tokens)、KV头压缩注意力机制、轻量级MoE实现(动态路由+负载均衡)以及RoPE旋转位置编码。
2025-09-15 16:23:17
972
原创 RAGFlow集成SGLang部署的大模型:实现OpenAI API兼容的自定义LLM调用
RAGFlow是一款基于深度文档理解的开源检索增强生成(RAG)引擎,它通过结合信息检索和生成式AI的优势,解决现有技术在数据处理和生成答案方面的挑战。RAGFlow支持多种文档格式,能够从复杂格式的非结构化数据中精准提取知识,并提供清晰的关键引用来源,降低LLM的幻觉风险。SGLang是一款面向大语言模型的高性能推理引擎,专为大规模语言模型的高效推理而设计。它支持张量并行、流水线并行等分布式推理策略,能够有效利用多GPU资源,为企业级部署提供优异的性能表现。
2025-09-15 16:17:37
386
原创 3小时从0到1:快速打造专属大语言模型实战指南
在人工智能迅猛发展的今天,大语言模型(LLM)已成为技术领域的热点。许多人认为训练自己的语言模型需要大量时间和资源,但实际上,通过正确的方法和工具,你可以在短短3小时内从零开始构建一个属于自己的语言模型。本文将手把手教你如何使用MiniMind项目快速实现这一目标。通过MiniMind项目,我们可以在极短时间内构建和训练属于自己的语言模型。整个过程分为三个主要阶段:环境准备、预训练和微调。每个阶段都有明确的步骤和验证方法。先从测试现有模型开始,了解模型的基本能力。
2025-09-13 17:23:59
1005
原创 解决 MobaXterm 左侧文件列表(SCP/SFTP)不显示问题
MobaXterm 的左侧文件浏览器是其最实用的功能之一,通过确保正确启用 SCP 文件传输选项,大多数文件列表显示问题都可以解决。如果问题仍然存在,请检查服务器权限和网络设置,或尝试重新创建会话。希望本指南能帮助您顺利使用 MobaXterm 管理远程服务器文件。如有其他问题,欢迎在评论区留言讨论。
2025-09-13 17:23:13
1148
原创 vLLM 和 SGLang开启工具调用能力的参数--tool-call-parser 不通用???
本文介绍了在vLLM和SGLang框架中部署Qwen3大模型并启用工具调用功能的配置差异。重点指出vLLM使用--tool-call-parser hermes参数,而SGLang需使用--tool-call-parser qwen25参数,两者不可混淆。文章提供了完整的部署示例和测试方法,并强调若项目已内置解析器则无需额外指定该参数。最后提示用户注意框架参数差异,避免配置错误导致部署失败。
2025-09-12 10:53:33
1515
原创 正确使用 SGLang 和 vLLM 中为 Qwen3 开启工具调用能力的完整指南
本文介绍了在vLLM和SGLang框架中部署Qwen3大模型并启用工具调用功能的方法。主要内容包括:vLLM中需配置--tool-call-parser hermes和--enable-auto-tool-choice参数,SGLang中使用--tool-call-parser qwen25参数;提供了完整的部署命令示例和测试工具调用的curl请求模板;对比了两个框架的关键参数差异;总结了常见问题解决方案和性能优化建议。正确配置后,Qwen3能够充分发挥其外部工具调用能力,为AI应用开发提供支持。
2025-09-12 10:51:53
1545
原创 如何解决 SGLang 启动 Qwen3 模型时报错:unrecognized arguments: --enable-auto-tool-choice
在使用SGLang部署Qwen3大模型时,若遇到--enable-auto-tool-choice参数报错,需注意SGLang与vLLM框架的参数不兼容问题。解决方案是移除该参数,改用SGLang支持的专用参数:工具调用功能使用--tool-call-parser qwen25,推理功能使用--reasoning-parser qwen3。本文对比了两个框架的参数差异,提供了完整的部署示例和测试方法,并强调不要混合使用不同框架参数。最终建议开发者根据官方文档选择正确的参数配置,确保模型功能正常启用。
2025-09-12 10:49:35
932
原创 解决NVIDIA-SMI报错:Failed to initialize NVML: Driver/library version mismatch
摘要:当Linux系统出现"NVIDIA驱动版本不匹配"(NVML错误)时,通常是由于内核模块与用户库版本不一致导致。解决方法包括:1)优先尝试重启系统;2)手动卸载并重载内核模块;3)确保安装匹配的驱动版本(如通过apt安装对应版本);4)必要时使用官方.run文件手动安装。预防措施建议使用统一安装源、定期更新后重启系统。该问题本质是版本不一致,通过版本对齐即可解决。(149字)
2025-09-11 10:17:17
1794
原创 如何查看GPU运行情况:使用 Conda 安装 nvitop 新手指南
A[安装Miniconda/Anaconda] --> B[创建Conda环境<br>conda create -n nvitop-env python=3.9]B --> C[激活环境<br>conda activate nvitop-env]C --> D[安装nvitop<br>pip install nvitop]D --> E[验证安装<br>nvitop]E --> F{运行是否正常?F -- 是 --> G[🎉 安装成功]F -- 否 --> H[排查_curses等问题]
2025-09-11 10:09:51
904
原创 Vue项目构建与部署指南:从yarn build到运行生产版本
如果你的Vue应用使用了Vue Router的history模式,需要确保服务器配置正确重定向所有路由到index.html,否则刷新页面会出现404错误。执行此命令后,终端会显示本地服务器地址(通常是http://localhost:3000),在浏览器中打开即可查看你的Vue应用。记得在部署前测试生产版本的功能是否正常,并确保服务器配置正确处理Vue Router的history模式(如果使用的话)。这个目录包含了优化后的静态资源文件,可以直接部署到任何Web服务器。你可以创建一个简单的部署脚本。
2025-09-10 17:06:13
507
原创 第一章 神经网络的复习:数学和python的复习
如上所示,可以使用 np.array() 方法生成向量或矩阵。该方法会生成NumPy 的多维数组类 np.ndarray。shape 表示多维数组的形状,ndim 表示维数。水平方向上排列称为行(row),垂直方向上的排列称为列(column);以下矩阵称为"3行2列的矩阵",记为"3x2的矩阵"对应多维数组中的元素(独立)进行的,这就是 NumPy 数组中的对应元素的运算。向量可以表示为排成一排的数字集合,在 Python 实现中可以处理为一维数组。会自动扩展成2X2的矩阵(),这种自动扩展的功能称为。
2025-09-09 15:51:38
342
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅