
文|宙斯盾流量安全分析团队
晨晨、彦修
背景
长期以来,Web管理后台一直是攻击者觊觎的目标。部分信息安全意识薄弱的业务在未作任何安全加固(设置IP白名单、强口令、二次认证、验证码、请求频率审计等)的情况下直接将Web管理后台暴露到互联网,而管理后台由于本身的管理和敏感属性,外部一旦攻击成功,则极大可能造成数据泄露和服务器被入侵。
所以,Web管理后台的检测一直是Web漏洞扫描器规则中比较重要的组成部分,而传统识别方法基于关键字,误报和漏报的问题比较突出,规则一旦形成,除非人为更改,否则长期处于停滞状态,灵活性较差。此外目前大量网站基于动态网页进行展示,传统扫描器如果不进行JS渲染,则漏报严重;而逐个渲染,则时间花销大、成本又非常高。
于是我们将目光转向利用机器学习来识别Web管理后台。此外,笔者所在的团队是基于流量来进行安全分析建设工作的,所以如何利用流量的优势实现对Web管理后台的识别,也是本文一大重点。
传统 VS AI
在介绍具体机器学习的时候我们可以先思考一个非常简单的问题,怎么识别phpinfo页面呢?
答案很简单,我们通常会找一些页面特征作为规则去匹配响应。但是如果针对下图中的页面怎么判定是否为风险呢?

图片源自spring actuator
我们当然也可以选择其中一些字段作为

本文探讨了利用机器学习识别Web管理后台的方法,传统关键字识别存在的问题及机器学习的优势。通过流量识别、URL扫描和机器学习模型,构建了一个高效识别系统,提升了识别准确性和灵活性。该系统采用XGBoost算法,结合word2vec预处理,有效识别管理后台,减少误报和漏报。
最低0.47元/天 解锁文章
880

被折叠的 条评论
为什么被折叠?



