架构
文章平均质量分 85
王小工
java研发工程师、架构师、云计算、大数据、云原生、AI应用
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
vLLM(vLLM.ai)K8S生产环境部署Qwen大模型
生产级vLLM推理服务架构摘要 本文详细介绍了基于Kubernetes的生产级vLLM推理服务架构方案。系统采用分层设计,包含WAF/CDN安全层、API网关层和Kubernetes集群内的vLLM推理服务。关键特性包括: GPU资源隔离:专用GPU节点池配合taint/toleration机制 安全架构:Istio实现服务间mTLS,Kong网关提供JWT认证和限流 弹性伸缩:基于KServe和HPA实现自动扩缩容,支持GPU利用率指标 模型部署:Docker镜像封装量化模型,支持不可变部署 全链路监控:原创 2025-12-10 08:31:56 · 944 阅读 · 0 评论 -
vLLM(vLLM.ai)生产环境部署大模型
vLLM是一款高性能大语言模型推理框架,提供单机API、多机分布式和K8s容器化三种生产部署方案。部署前需确保环境满足CUDA 11.8+/12.1+、Python 3.8~3.11、NVIDIA显卡等要求。核心部署模式包括:1)单机API服务,支持多卡并行;2)多机分布式部署,适用于70B+大模型;3)K8s容器化方案,便于生产环境管理。所有方案均兼容OpenAI API接口,支持量化模型优化显存占用,并提供详细的环境验证、模型准备和性能调优指南。原创 2025-12-10 08:18:49 · 940 阅读 · 0 评论 -
架构-亿级流量性能调优实践
本文系统介绍了性能调优的完整方法论与实践经验。从基础概念(性能指标、优化手段、检测工具)到具体技术实现(代码优化、设计模式、并发编程、JVM调优),再到高并发场景实战(订单处理、商品详情页构建、支付系统优化)和数据库调优(SQL优化、索引调优、分库分表)。重点涵盖了阿里巴巴、天猫等真实业务场景下的性能优化案例,如百万级交易系统JVM调优、32万笔/秒订单的FullGC问题解决等,形成了一套完整的性能优化知识体系。原创 2025-09-04 10:54:49 · 430 阅读 · 0 评论 -
Gitlib 企业本地部署
在部署 GitLab 社区版或企业版到本地服务器时,你需要按照一系列步骤来安装和配置。以下是一个基本的指南,帮助你从零开始部署 GitLab。原创 2025-02-11 09:37:58 · 1324 阅读 · 0 评论 -
一文读懂 DDD领域驱动设计
DDD(Domain-Driven Design,领域驱动设计)是一种软件开发方法,它强调软件系统设计应该以问题领域为中心,而不是技术实现为主导。DDD通过一系列手段如统一语言、业务抽象、领域划分和领域建模等来控制软件复杂度,主要用来指导如何解耦业务系统、划分业务模块、定义业务领域模型及其交互。原创 2024-08-27 18:33:58 · 2280 阅读 · 0 评论 -
数据库设计说明书模板
V1.0初稿1 引言1.1编写目的1.2术语1.3预期读者与阅读建议1.4参考资料2 设计数据表结构2.1系统用户表:sys_user2.2角色表:sys_role2.3用户角色表:sys_user_role。原创 2024-08-09 10:14:10 · 2039 阅读 · 0 评论 -
MES 功能模块
MES系统(Manufacturing Execution System,生产执行系统)是制造业企业的关键管理系统之一,它通过集成生产计划、工艺流程、物料管理和生产过程数据等,实现了对生产和制造过程的全面管理和监控。原创 2024-07-11 09:00:27 · 2193 阅读 · 0 评论 -
SpringCloud 服务调用 spring-cloud-starter-openfeign
spring-cloud-starter-openfeign 是 Spring Cloud 中的一个组件,用于在微服务架构中声明式地调用其他服务。它基于 Netflix 的 Feign 客户端进行了封装和增强,使其与 Spring Cloud 生态更好地集成。原创 2024-06-06 08:58:39 · 2498 阅读 · 0 评论 -
【开源】APIJSON 框架
APIJSON是一个关于API和JSON的综合技术或框架,一种专为API设计的JSON网络传输协议,以及基于这套协议实现的ORM库。2. 读取(Read)**功能:**通过APIJSON,你可以从数据库中检索数据。实现:定义API接口,指定请求方法(如GET)、URL和查询参数(可选)。发送请求,APIJSON后端服务将根据查询参数从数据库中检索数据。**示例:**要检索所有用户,你可以发送一个GET请求到/api/users。要检索特定用户(如ID为1的用户),你可以发送GET请求到/原创 2024-06-04 18:45:30 · 4575 阅读 · 0 评论
分享