- 博客(273)
- 收藏
- 关注

原创 从 0 到部署上线,打造你的 AI 工程力:TensorFlow 全栈实战专栏【开篇】【持续更新】
本章作为 TensorFlow 全栈实战专栏的开篇,系统阐述了为何仅掌握模型训练远不足以支撑真实 AI 工程交付,提出“模型 ≠ 产品”的核心观点。通过对 PyTorch 与 TensorFlow 架构差异的深入比较,明确了 TF 在跨平台部署与 MLOps 体系中的工程优势。本章还概览了专栏的完整章节结构与项目体系,为读者构建起从底层机制到工程实践的 AI 技能图谱,奠定全栈成长路径的基础。
2025-03-24 11:23:36
1530
1
原创 多机器人系统架构与调度模型实战
随着机器人系统逐步从“单体智能”走向“多体协作”,构建一个稳定、高效、可扩展的多机器人系统架构成为研发团队必须面对的关键课题。本篇将系统梳理多机器人系统的典型架构、通信机制、调度模型及其在 ROS 中的落地实践,结合行为树/状态机/任务分配/避碰策略/系统资源管理等内容,帮助你从系统设计层面掌握**“如何让一群机器人协同有序地完成任务”**。
2025-04-05 15:43:51
119
原创 打造企业级 DevOps AI 助手平台
能力模块效果构建分析智能化不再依赖人工翻日志,AI 自动诊断、归因、建议反馈处理自动化用户反馈、测试结果、Crash 数据联动构建优化策略决策行为闭环化分数不高就不给上线、崩溃高就强制灰度、失败就自动修平台能力模块化接入 CI、接入消息系统、接入发布系统企业级可治理权限分明、审计完整、执行透明。
2025-04-05 14:13:33
388
原创 RAG 检索链路追踪系统构建实战:打通向量检索 → Prompt 拼接 → 问题定位的全链路可观测体系
本文聚焦于国产大模型 RAG 系统中的“检索黑箱问题”:明明有知识却没命中?输出错误却无从排查?我们将构建一个轻量、高效、可视化的检索链路追踪系统,实现 request_id 全链路绑定、embedding 配置记录、检索命中片段持久化、Prompt 拼接还原,以及 Streamlit 可视化界面。本文配套提供结构化日志模板 × 实战代码 × 可视化 demo,帮助你彻底打通 RAG 系统的检索可观测能力,为后续的调优、反馈闭环和版本对比评估打下基础。
2025-04-05 12:07:14
480
原创 RAG 系统构建闭环实战:数据清洗 × 嵌入策略 × 更新机制 × 多语言 × 权限控制
部署一个 RAG 系统很容易,但想让它持续稳定运转却很难。本文从实际落地角度出发,围绕知识数据处理 → 嵌入向量生成 → 实时更新机制 → 多语言支持 → 安全权限控制等关键环节,手把手梳理构建闭环知识系统的必备能力。
2025-04-05 11:47:03
761
原创 私有知识库 RAG 系统评估全指南:检索 × 生成 × 模型协同打分 × 问题诊断
你已经部署了 RAG 系统(基于国产大模型 + 向量检索 + 本地知识库),但效果总感觉差点意思?本文将系统拆解:RAG 整体评估思路 × 检索质量分析 × 回答准确率评估 × 问题诊断方法,并附带可落地的打分模板、分析脚本与典型异常案例。
2025-04-05 10:43:04
578
原创 微调后模型效果评估全指南:指标 × 工具 × 多版本对比 × 打分技巧
LoRA / QLoRA 微调完了,模型“看起来能回答”——但效果到底好不好?本文将系统讲解如何科学评估国产大模型微调后的效果,包括适合中文场景的自动化评估指标、人审策略、多版本对比方案,以及实用工具推荐,帮助你“有理有据”地验证模型是否训练成功。
2025-04-05 09:39:47
649
原创 多轮对话微调实战指南:打造你自己的国产模型(Qwen × DeepSeek 实测)
想让国产大模型像 ChatGPT 一样「多轮连贯对话」?这篇文章将手把手带你实现一套基于国产模型的多轮对话微调流程,从数据格式设计、历史轮次嵌入、模型选择,到 Qwen2.5 × DeepSeek-V3 实测效果与部署方案,彻底跑通专属 ChatBot 精调路径。
2025-04-05 08:26:30
399
原创 QLoRA 全流程实战指南:国产大模型低显存微调方案解析 + 实测
显存不够,就用QLoRA!本文聚焦 QLoRA 在国产大模型上的实战应用,从工作原理、适配条件、环境配置、训练流程,到 Qwen2.5、Baichuan2、DeepSeek-V3 等主流模型的实测结果与推荐参数,全流程手把手演示如何在 24GB 显卡上跑通 13B / 33B 的高质量微调任务。
2025-04-05 07:13:19
534
原创 用 LoRA 精调 Qwen2.5 模型:从训练数据到权重产出全流程实战
LoRA 微调到底怎么做?这篇文章带你从 0 到 1 跑通一套完整的 Qwen2.5 微调流程:训练数据怎么构、模型怎么挂 LoRA、如何跑出第一轮训练结果、怎么保存 + 加载权重、如何用 LoRA 产物搭建 API 服务。
2025-04-05 06:30:00
849
原创 构建过程异常智能检测与修复建议
能力模块内容构建失败类型分析汇总 Xcode、Gradle、npm、Docker 等常见失败日志识别与清洗自动提取错误上下文,高效构造诊断输入LLM分析模板设计提示词模板 + 结构化输出格式智能建议输出Markdown / JSON / 飞书卡片 / GitHub 评论自愈逻辑设计条件匹配 → 自动追加命令 / 修复动作系统架构设计构建助手引擎 + 多模块调度 + 通知联动。
2025-04-04 23:30:00
791
原创 国产大模型微调准备指南:模型选型 × 数据格式 × 环境配置一次讲清
从实际落地出发,系统整理微调前你必须搞清楚的三件事:模型怎么选?(不是“越大越好”)数据怎么构?(别乱写 json,格式不对模型不学)环境怎么配?(依赖一堆?显存爆炸?提前防坑)
2025-04-04 23:00:00
395
原创 自定义训练数据构建实践:如何让你的模型“说你想说的”?
oRA 微调的核心价值,不在于“调了”,而在于“调得准”。本文聚焦 国产大模型训练数据构建实战,从任务拆解、样本设计、语气风格控制、业务术语注入,到样例编写与质量评估,全面剖析如何构造一批能真正让模型“说你想说的”的高质量数据集。
2025-04-04 20:57:40
572
原创 DevOps AI Loop:构建 → 反馈 → 优化的自循环闭环
是一种以反馈为输入、以 AI 为判断中枢、自动影响构建/测试/发布行为的 DevOps 智能演进机制。数据 → 不止展示 →要反馈给系统产生动作报告 → 不止分析 →要落到构建逻辑的改动决策 → 不止人拍板 →要自动参与上线节奏与测试覆盖模块能力闭环认知理解 DevOps 最大缺口是反馈缺乏反向驱动系统构建构建评分 × LLM 归因 × 策略建议 × 行为反馈形成闭环案例实战自动灰度、测试优先级调整、构建 retry patch 等可扩展性。
2025-04-04 18:52:27
381
原创 策略 AutoML 与微调系统:构建 AI 自动调仓引擎
就是在给定组件池的前提下,搜索出一组最优策略结构组合。类型可选组件因子池ROE、RSI、公告情绪、机构持仓择时RSI超卖、舆情反转、市场温度判断仓位模型等权、加权、止盈滚动风控规则个股止损10%、行业集中不超30%、波动率限制调仓频率日 / 周 / 月策略风格标签稳健 / 激进 / 波段型策略A = 因子[ROE+舆情] + 择时[RSI反弹] + 仓位[等权] + 风控[止损10%]
2025-04-04 18:17:09
607
原创 多模型部署之后怎么测?怎么监控?稳定性 × 负载监控 × 故障定位一站式实战指南
在国产大模型多模型部署落地后,是否遇到这些问题:显存突然爆掉服务挂了?模型没响应但日志什么都没有?多用户请求互相干扰?本篇从实战角度出发,手把手带你构建一整套「测试 + 监控 + 告警」闭环体系,包括:多模型健康检查与压测脚本编写(支持 locust / shell)GPU/显存/内存监控搭建(Prometheus + dcgm-exporter)自动异常捕捉与企业微信实时告警(loguru + WebHook)全链路可观测结构图与推荐指标组合
2025-04-04 18:16:19
704
原创 构建版本智能评分机制设计:用 LLM 打造 DevOps 决策大脑
构建平台自建 Dashboard,可将 JSON 报告 POST 到 API支持版本对比、趋势归档、日报留存与追踪模块能力Prompt 构建标准化日报内容构造输入多格式输出Markdown / JSON / 飞书卡片多渠道推送飞书 / 邮件 / GitHub 评论 / WebhookLLM 总结风险归因 × 推荐策略 × 构建亮点提取高阶能力多语言日报 / 趋势分析 / 对比生成企业落地三阶段部署建议 + 可持续集成路径。
2025-04-04 18:14:24
663
原创 为什么你需要微调国产大模型?Qwen × DeepSeek × Baichuan 微调价值全解析
本文聚焦 国产大模型微调实战全流程,以 Qwen2.5 为例,结合 LoRA 精调技术,从业务场景剖析、模型选型建议、微调方式对比(LoRA / QLoRA)、训练数据构建,到完整训练脚本与推理部署,全流程演示国产模型精调闭环,助你构建属于自己的“企业知识型模型”。
2025-04-04 14:46:24
394
原创 国产大模型多模型部署如何保持上下文不混乱?用户隔离 × LoRA切换 × 多租户上下文管理
在国产大模型部署中,尤其是涉及多个模型、多用户、LoRA adapter 热切换、企业多租户场景时,如何管理好“上下文”成为决定服务稳定性与体验的关键。本文围绕真实部署痛点,系统讲解上下文污染的常见现象、Session ID 映射机制、LoRA 切换策略、租户级隔离设计,以及 Redis × SQLite × TTL 的上下文缓存结构。并附带完整 SessionManager 模板,助你快速构建高稳定、高可控、高并发适配的上下文管理模块。
2025-04-04 12:43:40
409
原创 构建版本智能评分机制设计:用 LLM 打造 DevOps 决策大脑
构建评分不是静态规则,而是一个持续进化的智能模块模块能力分数计算JSON标准scorerisk_levelLLM协作归因总结 × 风险判断 × 推荐上线策略联动策略CI拦截 / 灰度控制 / 审批建议报告输出Markdown日报 / 风险摘要 / API联动智能演进Agent自学习 / 趋势预测 / 决策闭环本文是《AI × DevOps 模块》系列第2篇,如果你也希望 DevOps 不只是自动化,而是真正拥有“智能大脑”,
2025-04-04 12:37:13
581
原创 策略 AutoML 与微调系统:构建 AI 自动调仓引擎
输入:CI 构建失败日志 / 构建输出日志(raw text)输出:失败模块、失败原因、可复现方式、影响描述xcodebuild第 7 步签名失败,可能证书过期推荐动作:检查match仓库是否更新,或 Apple 账号是否锁定你是一个构建日志分析专家。请根据以下构建控制台输出,回答:- 本次构建失败的最可能原因是?- 是否可复现?是否由配置引起?- 推荐开发者下一步操作?【构建日志】:<<<BUILD_LOG>>>构建完成│├──➡ 收集构建日志(最后200行)
2025-04-04 10:30:00
503
原创 Flutter × React Native DevOps 构建全流程实战
能力模块能力描述📦 多端构建Flutter / RN 输出 APK、IPA、Web🔐 签名注入Android keystore / iOS P12 自动注入构建流🚀 自动上传蒲公英 / Firebase / TestFlight 多渠道上传流程📊 构建指标日志结构化 / 指标上传 / 可视化🧠 构建反馈Crash + 用户行为 + build_id 回溯🔐 安全机制依赖扫描 / 权限管控 / 构建审计🧰 工具推荐。
2025-04-04 09:45:00
635
原创 如何为多模型部署加一道“权限防火墙”?API调用控制 × 用户绑定 × 安全隔离实战
在多模型部署日益常态化的国产大模型实战中,接口权限控制往往被低估。本篇聚焦如何为你的国产大模型部署系统构建一套“权限防火墙”:通过 API Key 授权机制、user_id / role 动态映射、模型调用白名单与限流防刷策略,实现“谁能调用哪个模型、调用频率受控、模型不被刷爆、日志可审计”的完整访问控制体系。适用于:企业内网部署 / 多 LoRA 模型管理 / SaaS 多租户平台 / API 对外开放服务。附带可复用模板与中间件封装建议,一文构建国产模型部署的“访问安全闭环”。
2025-04-04 05:21:20
434
原创 国产大模型部署后的最大隐患:显存泄漏 × 模型残留 × 性能退化?一文搞懂如何诊断与优化
热更新 ≠ 动态加载动态加载指的是:每次请求按需加载 adapter而热更新则是指:✅ 模型文件更新 → 服务能自动检测 → 重新加载最新版本 → 不影响其他正在运行的请求通过这一篇,我们完整分析了国产大模型部署后,最容易出问题却最容易被忽视的一类情况:📉 模型运行一开始很顺,之后越来越卡,最终彻底崩了。我们称之为性能退化型部署隐患模型部署不止是“能跑起来”,而是能稳定运行 × 能持续维护 × 能智能感知问题。
2025-04-03 22:15:00
699
原创 国产大模型部署后怎么保证稳定运行?日志记录 × 异常监控 × 报错自愈 全流程实战
异常点应对策略推理失败try/except 包裹,返回 fallbackadapter 加载失败加载前检查路径、结构、权限模型爆显存清 cache + 提前加载 + batch 控制服务挂掉添加健康检测接口 + 监控上报脚本我们这一篇,围绕“模型部署上线之后如何稳定运行”,讲了很多真实项目中常见的痛点与解决方案。现在,我们把它总结成一套你可以照搬、能落地、能复用的稳定部署体系。
2025-04-03 21:45:00
647
原创 自动测试、用户反馈与构建数据的集成与利用(Crashlytics × TestFairy × 分析工具闭环)
移动端 DevOps 不只是从「开发到构建」,更是从构建到发布,再回到构建的智能反馈闭环。如果构建之后的崩溃日志、用户行为、测试反馈没有被系统性利用:这些反馈机制应成为 DevOps 流水线触发后续 Job 的“决策输入”。自动测试 = 构建质量的第一道防线,是 DevOps 的自然前置步骤。但很多移动端项目存在误区:测试结果统一上传:✅ iOS 示例:使用 XCTest 测试并输出结果配合 GitHub Summary 或 Allure 展示测试结果。崩溃日志是“最真实”的用户反馈。Fireb
2025-04-03 21:00:00
697
原创 国产大模型精调部署怎么最稳?一套搞定:QLoRA × LoRA加载 × 接口集成 × 推理加速
经过这一篇,我们已经完整走通了精调模型从训练产物 → 正确加载 → 封装服务 → 多模型管理 → 推理加速的一整套流程。这一章我们不再赘述细节,而是给你一套照着用就能跑起来的推荐组合清单。精调只是开始,能部署好、跑得快、接得上,才是真正的“落地智能”。
2025-04-03 20:15:00
505
原创 在 Jetson 上部署 Qwen2.5:国产轻量大模型的边缘推理全流程实战
本文系统讲解了如何在 Jetson 边缘设备上部署国产大模型 Qwen2.5,覆盖模型选型、格式转换(GGUF / ONNX / TensorRT)、推理框架接入(llama.cpp × ctransformers)、性能实测(tokens/s × 显存 × 延迟)及 API 封装与 Web UI 构建,完整实现边缘 AI 本地问答助手。从低功耗推理到局域网交互,为你构建稳定可控的轻量大模型系统提供实战参考。
2025-04-03 17:49:23
1014
原创 多模型部署的资源调度机制实战指南:GPU 分配 × 动态切换 × 多实例组合
简单说:✅ 每个模型独立运行在一个进程 / 容器 / 显卡上,互不干扰✅ 每个服务暴露不同端口,对接网关统一管理✅ 一个模型挂了,不会影响其他模型场景推荐部署方式单机、多模型、资源充足Supervisor + 多服务云端部署 / 团队协作资源紧张 / 模型较小多 adapter 热切换 + 单服务极限显存控制轮询式模型加载(一次只加载一个)用法示例获取显卡数量当前 GPU ID设置默认 GPU创建张量在指定卡上移动模型到指定卡。
2025-04-03 16:09:36
693
原创 AI 策略生成器全流程实战:从信号拼装到可解释下单逻辑
AI 帮你不是“写几个因子”,而是帮你“变成策略研究部 × 智能交易部 × 风控审计部”的总和。
2025-04-03 15:00:00
1384
原创 国产大模型 API 怎么封装才最香?FastAPI / Flask / vLLM / 本地服务全方案对比
FastAPI 是目前国产模型 API 封装🚀速度快:基于 Starlette,支持异步✅结构清晰:路径定义灵活,文档自动生成💡兼容性强:可模拟 OpenAI API 格式🔧易集成:可快速接入日志、限流、权限等中间件FastAPI 是目前国产模型 API 封装🚀速度快:基于 Starlette,支持异步✅结构清晰:路径定义灵活,文档自动生成💡兼容性强:可模拟 OpenAI API 格式🔧易集成:可快速接入日志、限流、权限等中间件模型部署是一半,API 封装是另一半;
2025-04-03 12:00:00
787
原创 移动端 DevOps 构建安全合规治理机制:日志审计 × 构建链条保护 × 企业合规对接实践
能力工具/方法落地建议审批流按环境与分支分权日志审计每次构建自动上传结构化日志风险分析自研 LLM Agent / ChatGPT API生成构建风险摘要、提示上线建议合规报告生成自动导出 Markdown → PDF提交至安全团队归档构建镜像沙箱化提高构建可控性与可信度能力模块内容覆盖构建日志审计✅ JSON 日志结构 + 日志平台对接构建产物可追溯性✅ SLSA 构建 Provenance + SBOM 清单企业合规适配。
2025-04-03 11:30:00
760
原创 打造高质量行业语料的混合构建方案:开源 × 私有 × 合成的策略融合
数据源优点缺点最佳用法开源语料快速获取,任务标准贴合度低冷启动、格式参考、训练测试私有数据真实业务,最懂你敏感、结构乱精调主力、用户模拟、智能体语料合成数据灵活可控,批量生成幻觉风险、需二次校验多样性扩展、少样本增强能力名称能干什么样本池管理分类存储、搜索、权限控制、标签标注数据质量监控自动统计结构完整性、冗余率、打分趋势数据版本管理每一轮训练用哪些数据源、用的哪一版?可视化筛选低分样本、冗余样本、高质量样本一键过滤输出一键打包导出。
2025-04-03 10:00:00
592
原创 用 5 条数据搞定行业专家模型:Few-shot Prompt × 微调联合实战指南
在大模型时代,"数据为王"的传统理念正悄然被颠覆。本文系统讲解了如何通过Few-shot Prompt + LoRA 微调,仅用 5~100 条样本,构建高质量、领域专家级的定制模型。内容涵盖:Few-shot Prompt 的设计原则与高质量样本构建方法LoRA 微调的轻量实践流程与配置建议三类输出方式(原始模型 / Prompt / 微调)的实战对比模型上线部署策略、版本管理、A/B 实验与可视化平台建议
2025-04-03 08:20:46
1006
原创 部署国产大模型老是显存炸?我用一张3090实测了这些关键点
很多人只知道模型越大越占显存,但不知道显存炸在哪。3090 可以跑大模型,但请别当它是 A100。模型必须量化(int4)精调后不能一次性加载太多 adapter推理必须限制输出长度串行请求、多模型切换需及时释放显存任务推荐模型推荐部署方式显存占用本地问答测试~11.5G单模型部署int4~9.5G多模型测试不建议并发加载逐个切换≥18G图文模型(Omni)❌ 不建议建议 >= 40G 显卡❌。
2025-04-03 06:30:00
757
原创 合成数据是出路吗?基于 LLM 生成数据的注意事项与实战技巧
未来的 AI 能力不只来自大模型参数,而来自你是否拥有一套完整的数据构建与治理能力。合成数据,就是你在资源有限的现实里打破壁垒的那块“魔法加速石”。
2025-04-03 00:08:48
609
原创 移动端 DevOps 构建全链条可视化治理平台设计:日志 × 指标 × 威胁画像 × 响应机制
,},能力模块覆盖内容日志系统建设✅ 行为日志、构建日志、结构化 JSON指标体系✅ KPI + 安全指标 + Crash 反馈等风险画像✅ 构建评分、风险标签、异常点提取自动响应机制✅ 告警通知、构建中止、异常识别多角色协同✅ 多视图分离、权限控制、角色分责平台架构✅ 可部署技术栈、接入路径建议智能演进✅ LLM + 构建反馈 + 自愈能力未来蓝图。
2025-04-03 00:02:39
489
原创 国产大模型推理太慢?试试这5种提速神器,效果立竿见影!
国产大模型部署之后,推理慢成为最常见、最令人抓狂的问题之一:启动慢、响应慢、接口卡、显存爆……这篇文章基于真实部署实测,汇总了 5 种立竿见影的提速方法,包括:模型量化、vLLM 推理框架、静态 batching、多轮裁剪、轻量模型替代策略。
2025-04-02 22:01:14
363
原创 移动端 DevOps 构建安全机制:签名管理 × 权限审批 × 敏感变量隔离
将 hash 值上传到 OSS 与包一并保存。能力模块实战要点签名注入管理✅ 签名文件生命周期、安全注入机制权限与审批控制✅ 分支保护、审批机制、构建人审计敏感变量隔离✅ Secrets、安全注入、审查预防工具产物完整性保障✅ SHA 校验、签名验证、构建一致性控制行为监控告警✅ 构建日志分析 + 通知 + LLM 风险分析模板与治理架构✅ 标准化安全构建模板 + 多项目复用结构演进方向✅ AI 审计、零信任、构建供应链安全框架。
2025-04-02 21:48:00
842
1
毕业论文模版+论文写作技巧+答辩攻略
2025-03-31
基于 OpenPose 的人体姿态估计系统(支持深蹲/俯卧撑/硬拉识别 - Python源码+Streamlit界面)图像识别项目源码资源
2025-03-26
基于SpringBoot+Vue的校园失物招领系统(前后端分离+完整源码+数据库脚本)毕业设计
2025-03-26
基于TensorFlow的人脸口罩佩戴检测系统(含完整源码 + Streamlit界面 + 摄像头实时识别)适合毕业设计/课设项目
2025-03-26
基于TensorFlow的垃圾分类系统源码(MobileNetV2 + Streamlit 可视化 + 可训练)
2025-03-26
基于TensorFlow的图像修复系统源码(含GUI可视化界面 + 训练推理 + 单元测试)
2025-03-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人