- 博客(8)
- 收藏
- 关注
原创 大模型上线监控
大模型(LLM, Large Language Model)推理服务的生产环境中,核心监测指标需覆盖 性能、资源、服务质量、成本和稳定性 五大维度。以下是经过工业实践验证的关键指标清单,适用于如 vLLM、TGI、TensorRT-LLM 或自研推理引擎等部署场景。
2025-11-26 16:09:20
255
原创 Qwen25大模型微调实战:有监督SFT微调+部署+调用全流程
本文介绍了Qwen25大模型的微调实战系列,重点讲解了监督微调(SFT)方法。文章详细说明了LLaMAfactory框架的使用步骤,包括项目下载安装、数据格式要求(Alpaca和ShareGPT两种格式)以及配置文件编写。针对SFT微调过程,提供了完整的yaml配置示例和训练命令,并介绍了模型部署方法,包括融合模型部署和adapter动态部署两种方式。该系列后续还将涵盖DPO微调和大模型上线监控等内容,为开发者提供全面的Qwen25大模型微调实战指南。
2025-11-26 15:34:57
637
原创 【保姆级教程】本地部署Java环境:JDK+Maven+IDEA
本文介绍了在Windows系统上搭建Java开发环境的完整流程,包括JDK、Maven和IntelliJ IDEA的安装与配置。首先,从Oracle官网下载适合的JDK版本并配置JAVA_HOME环境变量;其次,从Apache官网获取Maven并设置MAVEN_HOME变量,同时修改仓库配置;最后,安装IntelliJ IDEA并配置Maven路径。通过文中提供的详细步骤和验证方法,读者可以顺利完成Java开发环境的部署,为后续项目开发做好准备。
2025-06-17 15:10:59
3585
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅