极个别的谭同学-优快云博客

原创八、智能体系统发布与运营体系

本文系统介绍了智能体系统的发布与运营全流程方案，包含功能发布、观测体系、上线审核三大核心模块。发布机制部分详细说明了功能开关配置、灰度发布流程和A/B测试设计方法；观测体系部分提供了LangSmith/LangGraph的集成配置指南和Grafana监控面板搭建方案；上线审核部分则规范了多级审核流程与关键审核材料模板。整套方案强调"小步快跑、风险可控"的迭代原则，通过工具链集成和标准化模板，为研发、测试、安全、运营团队提供可落地的协同作业框架，确保智能体系统安全稳定地交付与持续优化。

2025-11-10 17:58:24 31

原创六、基于昇腾A300的TensorFlow框架Qwen3模型实现与训练（理论篇）

本文详细阐述了基于昇腾A300硬件和TensorFlow框架的Qwen3大模型实现技术方案。系统采用分组查询注意力(GQA)机制、QK-Norm归一化方法和RoPE位置编码等创新设计，显著提升了模型性能。通过三阶段训练流程（预训练、监督微调、强化学习）和精细的内存优化策略（内存池、动态卸载、内存复用），实现了在64GB内存环境下高效训练235B参数规模的超大规模模型。工程实现上采用分层架构和模块化设计，结合混合精度计算、算子融合等优化技术，充分发挥了昇腾NPU的硬件加速能力。

2025-10-15 09:47:08 129

原创七、基于昇腾A300的TensorFlow框架Qwen3模型实现与训练（实战篇）

本文为开发者提供Qwen3模型的简化版实现指南，包含环境搭建、代码实现和训练全流程。硬件要求包括64GB内存和昇腾A300 GPU，软件环境需安装特定版本的TensorFlow和昇腾驱动。核心模块实现了自注意力机制、多头注意力、RoPE位置编码和前馈网络，并构建了完整的Qwen3模型。训练分为预训练和监督微调两个阶段，使用WikiText-2和CNN/DailyMail数据集。文中还提供了常见问题排查方法和后续优化方向，如RLHF实现和模型量化。通过逐步指导，开发者可以完成简化版Qwen3的基本训练和应用。

2025-10-15 09:46:25 47

原创五、Model 层的负载均衡具体实现方案

本文介绍了Model层负载均衡的实现方案，核心目标是平衡服务质量与资源利用。方案采用统一模型网关架构，包含模型注册表、策略引擎、健康检查器等组件，支持四种核心策略：能力匹配（按任务复杂度路由）、负载均衡（轮询/权重/最小连接数）、故障转移（自动切换异常模型）和成本优化（优先调用低成本模型）。提供了完整的Python实现代码示例，包括模型选择、请求转发和健康检查机制。落地要点包括性能基准测试、动态权重调整和成本监控。该方案可直接应用于生产环境，支持灵活扩展新模型和策略。

2025-10-14 11:39:54 45

原创四、系统全栈技术架构深度解构

本文系统解构了智能体系统的全栈技术架构，采用分层设计理念，涵盖从用户交互到算力支撑的完整链路。架构分为七大核心层级：UI层提供差异化交互体验；Memory层实现多级数据存储；Auth层保障系统安全；Search&Obs层实现实时搜索与系统观测；Orchestration层负责任务调度；Model&Data层作为智能底座；Compute层提供弹性算力。每层详细阐述了技术选型对比、核心功能清单及实践注意事项，并配套环境部署脚本和权限配置模板。

2025-10-14 11:30:49 45

原创三、敏捷交付与团队配置

3人敏捷小队3周完成大模型智能体MVP开发：项目经理定义核心指标并把控节奏，全栈工程师快速搭建技术架构，产品经理设计自然交互流程。每周聚焦不同目标：第一周建立基础对话闭环，第二周实现多步业务流程，第三周完善安全部署。最终形成"开发-测试-迭代"的持续优化飞轮，以最小成本快速验证业务价值。这种精益开发模式将不确定性转化为可控的快速验证过程，是企业AI落地的有效方法论。

2025-10-14 11:15:37 49

原创二、成功构建企业级大模型智能体的13个关键技术

通过建立一个智能的“模型路由”，系统可以根据任务的复杂度、实时性要求和成本预算，自动调度不同的模型。利用LangSmith等工具，你可以完整追踪一次用户查询的“一生”：它被转换成了什么提示词、调用了哪个模型、模型思考了多久、使用了哪些工具、每一步的结果是什么。这确保了智能体的回答是基于事实和最新数据的，极大地减少了“胡言乱语”的现象。通过定义不同的智能体角色（如“研究员”、“分析师”、“审核员”），并为它们分配合适的目标和工具，系统能够以“团队协作”的方式攻克单一智能体难以处理的复杂任务。

2025-10-14 10:56:27 130

原创一、解密企业级大模型智能体产品失败的五大大核心原因

3.沦为技术演示（PPTAgent）：团队花费大量时间集成各种酷炫的工具（查天气、算数学、画图表），做出了一个在演示时效果爆棚的“样板间”，但一旦放到真实的业务环境中，却发现解决不了任何一个具体的、棘手的业务痛点。总结一下，成功的企业级智能体，始于一个精准的业务场景，构建于一个协调稳健的技术架构，运行在一个安全合规的沙箱内，其成长依赖于一个透明可观测的反馈系统，而其生存则依赖于一套精打细算的成本控制体系。使用专业的权限管理服务，对智能体的工具调用范围进行严格的沙箱限制，并对所有输入输出进行安全扫描和过滤。

2025-10-14 10:43:40 64

原创大模型推理迁移：从原理到实践——深入解析实现逻辑与关键步骤（昇腾 NPU）

本文探讨了大语言模型（LLM）推理迁移的关键技术与实现方法。推理迁移是将训练好的大模型通过优化适配迁移至特定硬件（如昇腾NPU）进行高效推理的过程，旨在提升性能、减少资源占用并简化部署。文章详细介绍了四个主要阶段：基础环境搭建、模型分析、模型开发与替换、框架接口调用，并解析了显存估算、时延吞吐等关键技术点。最后以ChatGLM2-6B为例，展示了从环境准备到精度测试的完整迁移流程。通过ATB加速库和MindIE模型库，开发者可实现大模型在专用硬件上的高性能推理部署。

2025-09-02 11:14:37 1088

原创 AI MCP 服务：智能问数背后的技术逻辑与业务整合之道

本文介绍了MCP（模型上下文协议）智能问数服务如何通过三层架构（协议层、智能层、资源层）实现从"数据检索"到"数据对话"的转变。该服务利用大型语言模型解析自然语言查询，自动生成数据操作指令，并通过标准化协议与数据源交互，显著提升企业数据交互效率。文章以贵安新区"全域一张图"为例，展示了MCP服务在数据治理、智能问答和决策支持方面的实践价值，并指出未来将发展为"数据智能体"网络，推动组织向数据驱动决策的新范式转变。

2025-08-22 18:04:43 719

原创《无银弹的架构：抱残守缺与成败论英雄》------ 架构思维

《无银弹的架构：软件工程中的复杂性治理与贵阳实践》探讨AI时代软件架构的本质与演进，指出架构是认知世界的结构化呈现，需平衡工具理性与人类价值。文章以贵阳实践为例，提出动态结构化治理范式：运用微服务解耦、认知协同框架和自动化验证流水线，有效控制技术债务增量。揭示架构师角色正转向AI训练师，未来需构建“架构即服务”生态，将复杂性转化为创新动力。强调优秀架构应实现模块化分工与价值创造的平衡，在有限周期内达成多方利益共识。

2025-08-14 23:02:07 1095 1

原创 Win10本地部署Ollama + AnythingLLM+nomic-embed-text 读取本地文档构建私有知识库

5、安装AnythingLLM工具后打开初始化界面，会进入到配置页面，在【LLM Preference】选项卡中，选择Ollama，然后配置【http://127.0.0.1:11434】、选择运行的大模型【qwen:4b】，token填【8192】6、下一步是配置【Embedding Preference】选项卡中，一样选择 Ollama，然后配置【http://127.0.0.1:11434】、选择运行的大模型【nomic-embed-text】，length填【512】

2024-05-10 14:29:11 17650 11

原创 Mysql5.6性能优化

合理安排资源、调整系统参数使MySQL运行更快、更节省资源。优化是多方面的，包括查询、更新、服务器等。原则：减少系统瓶颈，减少资源占用，增加系统的反应速度。

2023-12-08 10:31:46 252

原创 ElasticSeach集群及插件搭建文档

Elasticsearch 的次要版本比kibana的次要版本高通常会起作用，不过这样只是为了满足首先升级 Elasticsearch ，然后升级kibana的需要，（如 Kibana 5.0 和 Elasticsearch 5.1 ）。在这种配置中， Kibana 服务器启动时将会记录一个警告，因此两个版本不一致的情况只是暂时的，为了不记录警告，还得将 Kibana 升级到与 Elasticsearch 相同的版本。( 对于请求不多的业务，Client Node可不加，Master和Data一般足够)

2023-06-26 16:18:33 473 1

原创 Kylin分布式分析型数仓安装及应用

要注意这里在线运算量并没有减小，8亿条记录还是要扫描一次，只是参与的机器多了，所以快了，当达到一定数据体积的时候内存也满足不了容易OOM，还得用到磁盘，也无法满足查询实时性的问题，如果应用的场景是数据来源固定，但是查询不固定且要求速度时。3.使用ES来做数据的查询，全文检索，模糊匹配，相似度匹配等（由于ES是基于lucence的文件检索系统，但不仅限于lucence的功能，所以这块选择ES，ES在小数据的情况下做一些实时的统计分析还行，数据量达到亿级别时也会变的缓慢，这快不做过多介绍）；

2023-06-26 16:04:01 533 1

原创 Linux Yum源配置

Yum(Yellow dog Updater, Modified的简称)是杜克大学为了提高RPM 软件包安装性而开发的一种软件包管理器。其宗旨是自动化地升级，安装/移除rpm 包，收集rpm 包的相关信息，检查依赖性并自动提示用户解决。Yum主要功能是更方便的添加/删除/更新RPM 包，自动解决包的倚赖性问题，便于管理大量系统的更新问题。

2023-06-26 15:44:34 1796 1

原创 Sqoop数据迁移Oracle至HBase

拷贝驱动Oracle JDBC Driver至Sqoop安装目录lib下，本文档目录为/opt/cloudera/parcels/CDH-5.11.0-1.cdh5.11.0.p0.34/lib/sqoop/lib/测试Sqoop与Oracle数据库连接。命令示例：可能的报错：java.lang.RuntimeException: Could not load db driver class: oracle.jdbc.OracleDriver。

2023-06-26 15:39:50 789 1

原创 Centos7.6系统下SVN版本控制工具搭建及应用

SVN是subversion的缩写，是一个开放源代码的版本控制系统，通过采用分支管理系统的高效管理，简而言之就是用于多个人共同开发同一个项目，实现共享资源，实现最终集中式的管理。有些情况下服务器安装完成，配置完成后，无法连接svn服务器，可能是防火墙问题，所以要解决这个问题（根据系统版本自行修改，我的是centos7.6）注意，如果没有配置https访问，用客户端访问要使用svn://你的IP的方式，默认端口是3690.一般我们都是用小乌龟客户端，有条件的朋友可以自选工具。ok，到此SVN服务端安装完成！

2023-05-24 13:37:03 570

原创 linux docker安装及MYSQL安装（简单应用命令）

这里有一点需要注意一下，由于我拉取的是指定版本的mysql，所以在docker run的时候选择的也是mysql:5.7，如果你不写后面的版本号，默认他认为你想运行的是最新版本的mysql镜像，但是你没有拉取最新版镜像，所以系统会默认给你拉取一个最新版本的mysql镜像然后运行成容器，导致你拉取的指定版本的镜像并没有运行。使用mysql之前需要先安装mysql，在docker中可以直接拉取mysql的镜像，类似于我们理解的安装下载mysql。mysql -u root -p你的密码。

2023-02-08 13:21:32 241

转载 docker ORACLE安装和配置

原文链接：https://www.cnblogs.com/laoluoits/p/13942119.html。2. 登录sqlplus并修改sys、system用户密码。次操作则要使用oracle账户进行操作。1. 创建软连接需要使用root账户，oracle账户是没有权限的。按照上述步骤安装即可，以下是需要注意的点。

2023-02-08 13:20:00 176

原创 NGINX 安装

1.安装依赖：yum -y install gcc zlib zlib-devel pcre pcre-devel openssl openssl-devel make2.解压安装包并指定位置：tar -zxvf nginx-1.20.2.tar.gz -C /usr/local/nginx/3.解压后，cd到nginx目录：cd /usr/local/nginx/ (修改nginx文件夹名，可改可不改)，然后进行配置：./configure ，最后执行安装：make && make install4.c

2023-02-08 13:19:04 94

原创安装Redis级基本命令应用（centos 8.5系统）

修改 redis.conf 文件，把 daemonize no 改为 daemonize yes 以后台方式启动redis，daemonize 表示是否以守护线程方式启动。将 /usr/local/redis/redis-6.2.6 的源码目录中的 redis.conf 复制到 redis 的安装目录。安装完成后，/usr/local/redis 下多了一个bin 目录。添加systemd启动服务。

2023-02-08 13:18:20 214

原创 Centos系统下JDK 安装配置

执行java -version查看jdk安装情况。出现jdk版本号表示安装成功。显示此信息表示没有安装jdk。

2023-02-08 13:17:26 345

原创 MYSQL 新建用户并授权

说明：priv代表权限select,insert,update,delete,create,drop,index,alter,grant,references,reload,shutdown,process,file等14个权限。说明：给主机为192.168.10.1的用户john分配可对数据库test的hr表进行select,insert,update,delete,create,drop等操作的权限，并设定口令为123。‘pig’@’%’，则在使用REVOKE SELECT ON . FROM。

2023-02-08 13:16:20 185

原创 MYSQL 开启binlog日志，并实现备份数据库

在my.cnf主配置文件中直接添加三行三个参数来指定：第一个参数是打开binlog日志第二个参数是binlog日志的基本文件名，后面会追加标识来表示每一个文件第三个参数指定的是binlog文件的索引文件，这个文件管理了所有的binlog文件的目录。这一个参数的作用和上面三个的作用是相同的，mysql会根据这个配置自动设置log_bin为on状态，自动设置log_bin_index文件为你指定的文件名后跟.index。到此，binlog日志已成功开启。

2023-02-08 13:15:07 555

原创 Centos7防火墙开放端口基本命令

（5）关闭防火墙端口：firewall-cmd --zone=public --remove-port=9200/tcp --permanent。（4）开启防火墙端口：firewall-cmd --zone=public --add-port=9200/tcp --permanent。（3）查看开放的端口：firewall-cmd --list-ports。（1）查看防火墙状态：firewall-cmd --state。（2）重新加载配置：firewall-cmd --reload。–zone #作用域。

2023-02-08 13:03:12 1050

原创 linux docker安装篇（简单应用命令）

安装、运行、配置docker安装dockeryum install -y docker查看docker是否安装成功yum list installed | grep docker启动docker服务(并设置开机自启)systemctl start docker.servicesystemctl enable docker.service查看docker服务状态systemctl...

2022-01-11 09:36:00 99

原创 Sqoop依赖与hadoop

引言Sqoop依赖与hadoop 数据的一方，存储在hdfs 底层的数据传输实现map/reduce yarn 只有map任务因为官网sqoop没有hadoop2.5对应的版本，要根据hadoop的版本进行编译（好像不用对应版本也可以，不过建议最好对应版本）。所以这里使用CDH 5.3.6。比较稳定。去Cloudera的官网下载相应的发布版本号 http;//archiv...

2018-03-20 09:30:58 200 1

weixin_37847603的博客