自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_42881308的博客

原创显卡驱动、CUDA、NVIDIA Container Toolkit 内网离线安装教程**

摘要：本文详细介绍了在无法联网的服务器上私有化部署AI应用的基础环境搭建流程，包括离线安装NVIDIA显卡驱动、CUDA工具包、NVIDIA Container Toolkit和Docker。通过可联网机器下载所需安装包并传输至内网服务器，依次完成驱动安装（验证nvidia-smi）、CUDA配置（验证nvcc -V）、容器工具包部署及Docker引擎安装（验证docker version）。最终通过docker run --gpus all测试容器GPU调用能力，确保服务器具备运行AI应用的完整环境。文中

2025-12-24 14:16:13 849

原创 Docker+vLLM内网离线部署Qwen3 流程

本文介绍了在CentOS 7系统下进行VLLM容器化部署Qwen3-32B大模型的内网离线方案。首先需准备Nvidia显卡驱动、CUDA 12.4和Docker环境。通过联网机器拉取vllm/vllm-openai镜像并导入内网服务器，同时从魔塔社区下载模型文件。部署时使用docker run命令启动容器，配置了GPU资源、内存共享、端口映射等参数，特别指定了模型路径、并行计算、内存利用率等关键参数。该方案实现了大模型在内网环境的安全高效部署，适用于需要离线运行的AI推理场景。

2025-12-14 12:38:40 432

原创 NPM 包发布完整实战方案

本文详细介绍了NPM包发布的完整流程，包括环境准备、认证配置、预发布检查、正式发布和问题排查五个阶段。重点解决了双因素认证(2FA)导致的403错误问题，提供了两种解决方案：启用2FA或创建细粒度令牌。文章还包含发布脚本模板和常见错误排查表，强调认证有效性、包名唯一性、版本管理和文件完整性等关键成功要素。通过此方案可系统性地完成NPM包发布工作。

2025-12-14 11:30:12 344

原创 docker 下部署 vLLM 启动Qwen3-VL-32B-Instruct模型

摘要：本文介绍在CentOS系统下使用Docker部署vLLM启动Qwen3-VL-32B-Instruct大模型的完整流程。主要内容包括：1）拉取vLLM官方镜像和下载模型文件；2）提供详细的容器启动脚本，包含GPU分配、模型挂载、端口映射及多项优化参数配置；3）说明使用双A10显卡(TP=2)运行32B参数模型的关键设置；4）给出API测试验证方法。该方案针对大模型部署进行了内存、线程和安全策略等多方面优化，适合在有限显存环境下高效运行视觉语言大模型。

2025-12-04 20:05:51 235

原创 PolarDB-X下使用备份工具t-polardbx-engine-xtrabackup

本文针对PolarDB-X的xtrabackup工具在CentOS 8等新系统上的兼容性问题，提出两种零侵入解决方案。方案一通过创建独立目录存放旧版库文件，配合wrapper脚本和环境变量临时注入，实现兼容运行而不影响系统原有环境；方案二采用强制安装旧版库RPM包的方式快速解决依赖问题，支持一键卸载恢复。两种方案均无需降级系统组件或修改glibc，保持系统原有命令版本不变，支持自动化部署和快速回退，特别适合生产环境使用。

2025-12-03 14:27:57 522

原创 Windows 下安装UV

UV是一款专为Windows设计的轻量级命令行软件管理工具，仅需20MB即可实现类似Linux apt的软件管理体验。支持一键安装/卸载/更新软件（如uv install python@3.12），并提供临时沙盒模式（uvx ffmpeg执行后自动清理）。具有多版本切换、依赖冲突检测、无注册表污染等特点，所有软件缓存集中存储在用户目录。安装仅需三步：下载解压、添加PATH、验证版本，支持国内镜像加速，卸载时直接删除目录即可完全清理。开发者无需管理员权限即可快速搭建高效的命令行软件管理环境。

2025-11-07 19:07:35 531

原创 ARM 架构上基于 ProxySQL 部署 PolarDB-X 高可用集群实战指南

本文介绍了在ARM架构上部署基于ProxySQL的PolarDB-X高可用集群的实战指南

2025-11-01 23:51:24 488

原创 Ollama 通过GGUF 文件本地运行任何开源大模型

3、打开ollama 终端输入：ollama create baichuan2-7b -f Modelflie.txt。1、下载 GGUF --》Hugging Face 里搜索下载（baichuan gguf、qwen gguf）创建一个新的模型文件名字【baichuan2-7b】使用读取 Modelflie.txt 文件。2、下载文件到本地后然后在同目录创建一个 txt 文建。

2024-03-28 14:35:39 9248 2

原创 Jenkins 、gitlab、实现CICD持续集成

Gitlab 安装1 安装环境依赖2 获取gitlab 包3、安装gitlab-通过本地的 rpm 包安装gitlab3.1 继续执行4、修改gitlab 的配置5、测试gitlab命令行是否正确6、 gitlab 的相关命令7、gitlab 运行的组件如下：GitLab 由主要由以下服务构成，他们共同承担了 Gitlab 的运作需要Nginx:静态 web 服务器gitlab-shell:用于处理 Git 命令和修改 authorized keys 列表。

2023-11-28 19:37:04 239

原创【无标题】

JAVA操作Excel 可配置，动态生成复杂表头复杂的中国式报表表头。

2023-04-06 16:00:53 83 1

原创【无标题】

Mysql 千万级的数据表和重建索引

2023-02-27 15:31:48 517 1

UV 包，包括 wind 、linux 、arm

UV 包，包括 wind 、linux 、arm

2025-11-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄7年

11
原创

78
点赞

98
收藏

5
粉丝

关注

私信

热门文章

最新评论

Ollama 通过GGUF 文件本地运行任何开源大模型
m0_61255709: 你这样配置，模型给你回复的都是胡言乱语
Ollama 通过GGUF 文件本地运行任何开源大模型
优快云-Ada助手: 恭喜您成功发布了第四篇博客，标题看起来很吸引人！对于 Ollama 通过GGUF 文件本地运行任何开源大模型的探讨，我觉得您做得非常棒！希望您能继续保持创作的热情，探索更多有趣的主题。或许下一步可以尝试分享一些实际应用案例或者与其他领域的交叉探讨，这样可能会让读者更加深入地了解相关内容。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
【无标题】
优快云-Ada助手: 评论：非常感谢您的分享，这篇博客对于需要操作Excel的人来说非常实用。希望您能够继续分享更多的技能和知识，让我们更好地提升自己。此外，关于Excel操作的知识，您可以了解一下VBA编程，它可以为您的Excel操作带来更多的便利和效率。再次感谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434
【无标题】
优快云-Ada助手: 推荐 MySQL入门技能树：https://edu.youkuaiyun.com/skill/mysql?utm_source=AI_act_mysql

提示

确定要删除当前文章？

取消删除