点击蓝字⬆ 关注我们
本文共计1052字 预计阅读时长4分钟
腾讯云大数据智能管家TCInsight在已落地的专家经验及机器学习优化功能基础之上,推出了AI模型结合专家经验的大数据系统智能根因分析和SQL调优功能,通过智能化的方式帮助企业快速、精准地分析问题根源,提升运维效率,降低业务风险。
下面我们一同“起底”智能管家TCInsight的智能根因分析和AI SQL调优的核心能力。
“起底”智能根因分析
智能管家通过采集基础、资源、存储、计算等多维度的数据,结合预设策略及机器学习的优化策略智能识别异常点,并优先提供结合专家经验的处置方案。实际场景中往往存在更为复杂的根因传导链路,需要多层级的关联分析挖掘根因,据此智能管家通过AI大模型进行多维度多层级根因推导,提供异常关联拓扑、异常项Top及影响系数。初步支持从基础指标异常、基础事件维度进行分析挖掘,可帮助运维快速定位根因。
节点内存的使用率异常的分析除了需要分析当前节点的几十个指标还需要人工查看节点上部署的进程以及进程指标和同角色类型的服务指标,部署层级复杂,指标、事件等需要分析的范围也很广。
典型场景示例:
以“节点内存使用率异常分析”为例,除了需要排查节点的上百指标和节点上执行任务等其他信息,同时还需要人工查看节点上运行的进程及其相关数据,以及进程所归属服务的相关指标、事件及业务信息等。由于部署层级复杂,涉及的指标、事件等维度众多,排查范围广泛切繁琐,故整体分析排查过程非常耗时。
而通过智能管家AI特征分析识别指标异常,结合相关性分析报告可快速清晰提供影响因子的关联关系及影响系数,结合专家经验、关联分析算法及 AI 大模型识别影响系数的智能根因分析,可缩短故障分析时间 60% 以上。
“起底”SQL AI调优
新发布的Spark SQL智能调优功能,基于通用AI大模型对异常的SQL进行深度分析,智能生成SQL调优建议。
通过对查询的编译、输入输出、执行过程、资源消耗及同指纹历史信息的多维度异常分析,结合异常查询DeepSeek AI智能优化,给出优化项及优化 SQL,对比人工调优TPC-DS,使用智能管家可带来至少30%调优效率提升,帮助企业从业务层显著提升查询执行效率。
示例:
按照命中同一个表Fetched 100 rows数据,调优前后的执行时长存在差异。
AI调整前:Time taken: 511.94 seconds, Fetched 100 row(s)
AI调整后:Time taken: 493.798 seconds, Fetched 100 row(s)
下期“路透”
腾讯云大数据智能管家TCInsight将持续紧跟AI进步的脚步,继续深化专家经验与AI大模型结合,挖掘、支持更多场景的智能调优调参能力。
未来,我们计划将面向更多的异常场景,持续丰富优化算法模型,提升根因分析的精准度和效率;同时也会逐步沉淀调优闭环能力,如自动化调参、自动治理等,帮助企业实现从被动运维到主动优化的智能化运维转变。
腾讯云大数据始终致力于为各行业客户提供轻快、易用,智能的大数据平台。
END
关注腾讯云大数据╳探索数据的无限可能
⏬点击阅读原文
了解更多产品详情
分享给认识的人吧