自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 显卡驱动、CUDA、NVIDIA Container Toolkit 内网离线安装教程**

摘要:本文详细介绍了在无法联网的服务器上私有化部署AI应用的基础环境搭建流程,包括离线安装NVIDIA显卡驱动、CUDA工具包、NVIDIA Container Toolkit和Docker。通过可联网机器下载所需安装包并传输至内网服务器,依次完成驱动安装(验证nvidia-smi)、CUDA配置(验证nvcc -V)、容器工具包部署及Docker引擎安装(验证docker version)。最终通过docker run --gpus all测试容器GPU调用能力,确保服务器具备运行AI应用的完整环境。文中

2025-12-24 14:16:13 849

原创 Docker+vLLM内网离线部署Qwen3 流程

本文介绍了在CentOS 7系统下进行VLLM容器化部署Qwen3-32B大模型的内网离线方案。首先需准备Nvidia显卡驱动、CUDA 12.4和Docker环境。通过联网机器拉取vllm/vllm-openai镜像并导入内网服务器,同时从魔塔社区下载模型文件。部署时使用docker run命令启动容器,配置了GPU资源、内存共享、端口映射等参数,特别指定了模型路径、并行计算、内存利用率等关键参数。该方案实现了大模型在内网环境的安全高效部署,适用于需要离线运行的AI推理场景。

2025-12-14 12:38:40 432

原创 NPM 包发布完整实战方案

本文详细介绍了NPM包发布的完整流程,包括环境准备、认证配置、预发布检查、正式发布和问题排查五个阶段。重点解决了双因素认证(2FA)导致的403错误问题,提供了两种解决方案:启用2FA或创建细粒度令牌。文章还包含发布脚本模板和常见错误排查表,强调认证有效性、包名唯一性、版本管理和文件完整性等关键成功要素。通过此方案可系统性地完成NPM包发布工作。

2025-12-14 11:30:12 344

原创 docker 下部署 vLLM 启动Qwen3-VL-32B-Instruct模型

摘要:本文介绍在CentOS系统下使用Docker部署vLLM启动Qwen3-VL-32B-Instruct大模型的完整流程。主要内容包括:1)拉取vLLM官方镜像和下载模型文件;2)提供详细的容器启动脚本,包含GPU分配、模型挂载、端口映射及多项优化参数配置;3)说明使用双A10显卡(TP=2)运行32B参数模型的关键设置;4)给出API测试验证方法。该方案针对大模型部署进行了内存、线程和安全策略等多方面优化,适合在有限显存环境下高效运行视觉语言大模型。

2025-12-04 20:05:51 235

原创 PolarDB-X下使用备份工具t-polardbx-engine-xtrabackup

本文针对PolarDB-X的xtrabackup工具在CentOS 8等新系统上的兼容性问题,提出两种零侵入解决方案。方案一通过创建独立目录存放旧版库文件,配合wrapper脚本和环境变量临时注入,实现兼容运行而不影响系统原有环境;方案二采用强制安装旧版库RPM包的方式快速解决依赖问题,支持一键卸载恢复。两种方案均无需降级系统组件或修改glibc,保持系统原有命令版本不变,支持自动化部署和快速回退,特别适合生产环境使用。

2025-12-03 14:27:57 522

原创 Windows 下安装UV

UV是一款专为Windows设计的轻量级命令行软件管理工具,仅需20MB即可实现类似Linux apt的软件管理体验。支持一键安装/卸载/更新软件(如uv install python@3.12),并提供临时沙盒模式(uvx ffmpeg执行后自动清理)。具有多版本切换、依赖冲突检测、无注册表污染等特点,所有软件缓存集中存储在用户目录。安装仅需三步:下载解压、添加PATH、验证版本,支持国内镜像加速,卸载时直接删除目录即可完全清理。开发者无需管理员权限即可快速搭建高效的命令行软件管理环境。

2025-11-07 19:07:35 531

原创 ARM 架构上基于 ProxySQL 部署 PolarDB-X 高可用集群实战指南

本文介绍了在ARM架构上部署基于ProxySQL的PolarDB-X高可用集群的实战指南

2025-11-01 23:51:24 488

原创 Ollama 通过GGUF 文件本地运行任何开源大模型

3、打开ollama 终端输入:ollama create baichuan2-7b -f Modelflie.txt。1、下载 GGUF --》Hugging Face 里搜索下载 (baichuan gguf、qwen gguf)创建一个新的模型文件 名字 【baichuan2-7b】 使用 读取 Modelflie.txt 文件。2、下载文件到本地后 然后在同目录创建一个 txt 文建。

2024-03-28 14:35:39 9248 2

原创 Jenkins 、gitlab、实现CICD持续集成

Gitlab 安装1 安装环境依赖2 获取gitlab 包3、安装gitlab-通过本地的 rpm 包安装gitlab3.1 继续执行4、修改gitlab 的配置5、测试gitlab命令行是否正确6、 gitlab 的相关命令7、gitlab 运行的组件如下:GitLab 由主要由以下服务构成,他们共同承担了 Gitlab 的运作需要Nginx:静态 web 服务器gitlab-shell:用于处理 Git 命令和修改 authorized keys 列表。

2023-11-28 19:37:04 239

原创 【无标题】

JAVA操作Excel 可配置,动态 生成复杂表头 复杂的中国式报表表头。

2023-04-06 16:00:53 83 1

原创 【无标题】

Mysql 千万级的数据表和重建索引

2023-02-27 15:31:48 517 1

UV 包 ,包括 wind 、linux 、arm

UV 包 ,包括 wind 、linux 、arm

2025-11-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除