自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 八、智能体系统发布与运营体系

本文系统介绍了智能体系统的发布与运营全流程方案,包含功能发布、观测体系、上线审核三大核心模块。发布机制部分详细说明了功能开关配置、灰度发布流程和A/B测试设计方法;观测体系部分提供了LangSmith/LangGraph的集成配置指南和Grafana监控面板搭建方案;上线审核部分则规范了多级审核流程与关键审核材料模板。整套方案强调"小步快跑、风险可控"的迭代原则,通过工具链集成和标准化模板,为研发、测试、安全、运营团队提供可落地的协同作业框架,确保智能体系统安全稳定地交付与持续优化。

2025-11-10 17:58:24 31

原创 六、基于昇腾A300的TensorFlow框架Qwen3模型实现与训练(理论篇)

本文详细阐述了基于昇腾A300硬件和TensorFlow框架的Qwen3大模型实现技术方案。系统采用分组查询注意力(GQA)机制、QK-Norm归一化方法和RoPE位置编码等创新设计,显著提升了模型性能。通过三阶段训练流程(预训练、监督微调、强化学习)和精细的内存优化策略(内存池、动态卸载、内存复用),实现了在64GB内存环境下高效训练235B参数规模的超大规模模型。工程实现上采用分层架构和模块化设计,结合混合精度计算、算子融合等优化技术,充分发挥了昇腾NPU的硬件加速能力。

2025-10-15 09:47:08 129

原创 七、基于昇腾A300的TensorFlow框架Qwen3模型实现与训练(实战篇)

本文为开发者提供Qwen3模型的简化版实现指南,包含环境搭建、代码实现和训练全流程。硬件要求包括64GB内存和昇腾A300 GPU,软件环境需安装特定版本的TensorFlow和昇腾驱动。核心模块实现了自注意力机制、多头注意力、RoPE位置编码和前馈网络,并构建了完整的Qwen3模型。训练分为预训练和监督微调两个阶段,使用WikiText-2和CNN/DailyMail数据集。文中还提供了常见问题排查方法和后续优化方向,如RLHF实现和模型量化。通过逐步指导,开发者可以完成简化版Qwen3的基本训练和应用。

2025-10-15 09:46:25 47

原创 五、Model 层的负载均衡具体实现方案

本文介绍了Model层负载均衡的实现方案,核心目标是平衡服务质量与资源利用。方案采用统一模型网关架构,包含模型注册表、策略引擎、健康检查器等组件,支持四种核心策略:能力匹配(按任务复杂度路由)、负载均衡(轮询/权重/最小连接数)、故障转移(自动切换异常模型)和成本优化(优先调用低成本模型)。提供了完整的Python实现代码示例,包括模型选择、请求转发和健康检查机制。落地要点包括性能基准测试、动态权重调整和成本监控。该方案可直接应用于生产环境,支持灵活扩展新模型和策略。

2025-10-14 11:39:54 45

原创 四、系统全栈技术架构深度解构

本文系统解构了智能体系统的全栈技术架构,采用分层设计理念,涵盖从用户交互到算力支撑的完整链路。架构分为七大核心层级:UI层提供差异化交互体验;Memory层实现多级数据存储;Auth层保障系统安全;Search&Obs层实现实时搜索与系统观测;Orchestration层负责任务调度;Model&Data层作为智能底座;Compute层提供弹性算力。每层详细阐述了技术选型对比、核心功能清单及实践注意事项,并配套环境部署脚本和权限配置模板。

2025-10-14 11:30:49 45

原创 三、敏捷交付与团队配置

3人敏捷小队3周完成大模型智能体MVP开发:项目经理定义核心指标并把控节奏,全栈工程师快速搭建技术架构,产品经理设计自然交互流程。每周聚焦不同目标:第一周建立基础对话闭环,第二周实现多步业务流程,第三周完善安全部署。最终形成"开发-测试-迭代"的持续优化飞轮,以最小成本快速验证业务价值。这种精益开发模式将不确定性转化为可控的快速验证过程,是企业AI落地的有效方法论。

2025-10-14 11:15:37 49

原创 二、成功构建企业级大模型智能体的13个关键技术

通过建立一个智能的“模型路由”,系统可以根据任务的复杂度、实时性要求和成本预算,自动调度不同的模型。利用LangSmith等工具,你可以完整追踪一次用户查询的“一生”:它被转换成了什么提示词、调用了哪个模型、模型思考了多久、使用了哪些工具、每一步的结果是什么。这确保了智能体的回答是基于事实和最新数据的,极大地减少了“胡言乱语”的现象。通过定义不同的智能体角色(如“研究员”、“分析师”、“审核员”),并为它们分配合适的目标和工具,系统能够以“团队协作”的方式攻克单一智能体难以处理的复杂任务。

2025-10-14 10:56:27 130

原创 一、解密企业级大模型智能体产品失败的五大大核心原因

3.沦为技术演示(PPTAgent):团队花费大量时间集成各种酷炫的工具(查天气、算数学、画图表),做出了一个在演示时效果爆棚的“样板间”,但一旦放到真实的业务环境中,却发现解决不了任何一个具体的、棘手的业务痛点。总结一下,成功的企业级智能体,始于一个精准的业务场景,构建于一个协调稳健的技术架构,运行在一个安全合规的沙箱内,其成长依赖于一个透明可观测的反馈系统,而其生存则依赖于一套精打细算的成本控制体系。使用专业的权限管理服务,对智能体的工具调用范围进行严格的沙箱限制,并对所有输入输出进行安全扫描和过滤。

2025-10-14 10:43:40 64

原创 大模型推理迁移:从原理到实践——深入解析实现逻辑与关键步骤(昇腾 NPU)

本文探讨了大语言模型(LLM)推理迁移的关键技术与实现方法。推理迁移是将训练好的大模型通过优化适配迁移至特定硬件(如昇腾NPU)进行高效推理的过程,旨在提升性能、减少资源占用并简化部署。文章详细介绍了四个主要阶段:基础环境搭建、模型分析、模型开发与替换、框架接口调用,并解析了显存估算、时延吞吐等关键技术点。最后以ChatGLM2-6B为例,展示了从环境准备到精度测试的完整迁移流程。通过ATB加速库和MindIE模型库,开发者可实现大模型在专用硬件上的高性能推理部署。

2025-09-02 11:14:37 1088

原创 AI MCP 服务:智能问数背后的技术逻辑与业务整合之道

本文介绍了MCP(模型上下文协议)智能问数服务如何通过三层架构(协议层、智能层、资源层)实现从"数据检索"到"数据对话"的转变。该服务利用大型语言模型解析自然语言查询,自动生成数据操作指令,并通过标准化协议与数据源交互,显著提升企业数据交互效率。文章以贵安新区"全域一张图"为例,展示了MCP服务在数据治理、智能问答和决策支持方面的实践价值,并指出未来将发展为"数据智能体"网络,推动组织向数据驱动决策的新范式转变。

2025-08-22 18:04:43 719

原创 《无银弹的架构:抱残守缺与成败论英雄》------ 架构思维

《无银弹的架构:软件工程中的复杂性治理与贵阳实践》探讨AI时代软件架构的本质与演进,指出架构是认知世界的结构化呈现,需平衡工具理性与人类价值。文章以贵阳实践为例,提出动态结构化治理范式:运用微服务解耦、认知协同框架和自动化验证流水线,有效控制技术债务增量。揭示架构师角色正转向AI训练师,未来需构建“架构即服务”生态,将复杂性转化为创新动力。强调优秀架构应实现模块化分工与价值创造的平衡,在有限周期内达成多方利益共识。

2025-08-14 23:02:07 1095 1

原创 Win10本地部署Ollama + AnythingLLM+nomic-embed-text 读取本地文档构建私有知识库

5、安装AnythingLLM工具后打开初始化界面,会进入到配置页面,在【LLM Preference】选项卡中,选择Ollama,然后配置【http://127.0.0.1:11434】、选择运行的大模型【qwen:4b】,token填【8192】6、下一步是配置【Embedding Preference】选项卡中,一样选择 Ollama,然后配置【http://127.0.0.1:11434】、选择运行的大模型【nomic-embed-text】,length填【512】

2024-05-10 14:29:11 17650 11

原创 Mysql5.6性能优化

合理安排资源、调整系统参数使MySQL运行更快、更节省资源。优化是多方面的,包括查询、更新、服务器等。原则:减少系统瓶颈,减少资源占用,增加系统的反应速度。

2023-12-08 10:31:46 252

原创 ElasticSeach集群及插件搭建文档

Elasticsearch 的次要版本比kibana的次要版本高通常会起作用,不过这样只是为了满足首先升级 Elasticsearch ,然后升级kibana的需要,(如 Kibana 5.0 和 Elasticsearch 5.1 )。在这种配置中, Kibana 服务器启动时将会记录一个警告,因此两个版本不一致的情况只是暂时的,为了不记录警告,还得将 Kibana 升级到与 Elasticsearch 相同的版本。( 对于请求不多的业务,Client Node可不加,Master和Data一般足够)

2023-06-26 16:18:33 473 1

原创 Kylin分布式分析型数仓 安装及应用

要注意这里在线运算量并没有减小,8亿条记录还是要扫描一次,只是参与的机器多了,所以快了,当达到一定数据体积的时候内存也满足不了容易OOM,还得用到磁盘,也无法满足查询实时性的问题,如果应用的场景是数据来源固定,但是查询不固定且要求速度时。3.使用ES来做数据的查询,全文检索,模糊匹配,相似度匹配等(由于ES是基于lucence的文件检索系统,但不仅限于lucence的功能,所以这块选择ES,ES在小数据的情况下做一些实时的统计分析还行,数据量达到亿级别时也会变的缓慢,这快不做过多介绍);

2023-06-26 16:04:01 533 1

原创 Linux Yum源配置

Yum(Yellow dog Updater, Modified的简称)是杜克大学为了提高RPM 软件包安装性而开发的一种软件包管理器。其宗旨是自动化地升级,安装/移除rpm 包,收集rpm 包的相关信息,检查依赖性并自动提示用户解决。Yum主要功能是更方便的添加/删除/更新RPM 包,自动解决包的倚赖性问题,便于管理大量系统的更新问题。

2023-06-26 15:44:34 1796 1

原创 Sqoop数据迁移Oracle至HBase

拷贝驱动Oracle JDBC Driver至Sqoop安装目录lib下 ,本文档目录为/opt/cloudera/parcels/CDH-5.11.0-1.cdh5.11.0.p0.34/lib/sqoop/lib/测试Sqoop与Oracle数据库连接。命令示例:可能的报错:java.lang.RuntimeException: Could not load db driver class: oracle.jdbc.OracleDriver。

2023-06-26 15:39:50 789 1

原创 Centos7.6系统下SVN版本控制工具搭建及应用

SVN是subversion的缩写,是一个开放源代码的版本控制系统,通过采用分支管理系统的高效管理,简而言之就是用于多个人共同开发同一个项目,实现共享资源,实现最终集中式的管理。有些情况下服务器安装完成,配置完成后,无法连接svn服务器,可能是防火墙问题,所以要解决这个问题(根据系统版本自行修改,我的是centos7.6)注意,如果没有配置https访问,用客户端访问要使用svn://你的IP的方式,默认端口是3690.一般我们都是用小乌龟客户端,有条件的朋友可以自选工具。ok,到此SVN服务端安装完成!

2023-05-24 13:37:03 570

原创 linux docker安装及MYSQL安装(简单应用命令)

这里有一点需要注意一下,由于我拉取的是指定版本的mysql,所以在docker run的时候选择的也是mysql:5.7,如果你不写后面的版本号,默认他认为你想运行的是最新版本的mysql镜像,但是你没有拉取最新版镜像,所以系统会默认给你拉取一个最新版本的mysql镜像然后运行成容器,导致你拉取的指定版本的镜像并没有运行。使用mysql之前需要先安装mysql,在docker中可以直接拉取mysql的镜像,类似于我们理解的安装下载mysql。mysql -u root -p你的密码。

2023-02-08 13:21:32 241

转载 docker ORACLE安装和配置

原文链接:https://www.cnblogs.com/laoluoits/p/13942119.html。2. 登录sqlplus并修改sys、system用户密码。次操作则要使用oracle账户进行操作。1. 创建软连接需要使用root账户,oracle账户是没有权限的。按照上述步骤安装即可,以下是需要注意的点。

2023-02-08 13:20:00 176

原创 NGINX 安装

1.安装依赖:yum -y install gcc zlib zlib-devel pcre pcre-devel openssl openssl-devel make2.解压安装包并指定位置:tar -zxvf nginx-1.20.2.tar.gz -C /usr/local/nginx/3.解压后,cd到nginx目录:cd /usr/local/nginx/ (修改nginx文件夹名,可改可不改),然后进行配置:./configure ,最后执行安装:make && make install4.c

2023-02-08 13:19:04 94

原创 安装Redis级基本命令应用(centos 8.5系统)

修改 redis.conf 文件,把 daemonize no 改为 daemonize yes 以后台方式启动redis,daemonize 表示是否以守护线程方式启动。将 /usr/local/redis/redis-6.2.6 的源码目录中的 redis.conf 复制到 redis 的安装目录。安装完成后,/usr/local/redis 下多了一个bin 目录。添加systemd启动服务。

2023-02-08 13:18:20 214

原创 Centos系统下JDK 安装配置

执行java -version查看jdk安装情况。出现jdk版本号表示安装成功。显示此信息表示没有安装jdk。

2023-02-08 13:17:26 345

原创 MYSQL 新建用户并授权

说明:priv代表权限select,insert,update,delete,create,drop,index,alter,grant,references,reload,shutdown,process,file等14个权限。说明:给主机为192.168.10.1的用户john分配可对数据库test的hr表进行select,insert,update,delete,create,drop等操作的权限,并设定口令为123。‘pig’@’%’,则在使用REVOKE SELECT ON . FROM。

2023-02-08 13:16:20 185

原创 MYSQL 开启binlog日志,并实现备份数据库

在my.cnf主配置文件中直接添加三行三个参数来指定:第一个参数是打开binlog日志第二个参数是binlog日志的基本文件名,后面会追加标识来表示每一个文件第三个参数指定的是binlog文件的索引文件,这个文件管理了所有的binlog文件的目录。这一个参数的作用和上面三个的作用是相同的,mysql会根据这个配置自动设置log_bin为on状态,自动设置log_bin_index文件为你指定的文件名后跟.index。到此,binlog日志已成功开启。

2023-02-08 13:15:07 555

原创 Centos7防火墙开放端口基本命令

(5)关闭防火墙端口:firewall-cmd --zone=public --remove-port=9200/tcp --permanent。(4)开启防火墙端口:firewall-cmd --zone=public --add-port=9200/tcp --permanent。(3)查看开放的端口:firewall-cmd --list-ports。(1)查看防火墙状态:firewall-cmd --state。(2)重新加载配置:firewall-cmd --reload。–zone #作用域。

2023-02-08 13:03:12 1050

原创 linux docker安装篇(简单应用命令)

安装、运行、配置docker安装dockeryum install -y docker查看docker是否安装成功yum list installed | grep docker启动docker服务(并设置开机自启)systemctl start docker.servicesystemctl enable docker.service查看docker服务状态systemctl...

2022-01-11 09:36:00 99

原创 Sqoop依赖与hadoop

引言Sqoop依赖与hadoop 数据的一方,存储在hdfs 底层的数据传输实现map/reduce yarn 只有map任务因为官网sqoop没有hadoop2.5对应的版本,要根据hadoop的版本进行编译(好像不用对应版本也可以,不过建议最好对应版本)。所以这里使用CDH 5.3.6。比较稳定。 去Cloudera的官网下载相应的发布版本号 http;//archiv...

2018-03-20 09:30:58 200 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除