基于逻辑回归的概率模型半自动化参数化:数据收集、准备与基础原理
在利用逻辑回归进行概率模型的半自动化参数化过程中,数据的收集、准备以及对逻辑回归基础原理的理解至关重要。下面我们将详细探讨这些方面的内容。
1. 数据收集
为了定义具有足够“通用性”属性的模型,我们需要从多个不同的数据源收集数据,这些数据源包括但不限于:
- 配置管理数据库(CMDB) :它是关于资产信息的丰富来源,主要用于存储系统组件的各种有用信息,维护这样的数据库是安全管理的最佳实践之一。
- 国家漏洞数据库(NVD) :提供了大量的漏洞信息。
- 通用漏洞披露(CVE) :包含了各种已知的漏洞信息。
- 通用漏洞评分系统数据 :可从(拓扑)漏洞扫描器(如OpenVAS)获得。
- 监控设备性能数据 :例如某些研究中提到的相关数据。
虽然这些数据源不会直接提供我们所需的数据,但可以通过一些方式加以利用。以CVE为例,假设一次网络攻击是对某个漏洞的利用,知道特定计算机或其他IT组件的供应商和版本后,我们可以在CVE数据库中查找该组件的漏洞列表以及通用漏洞评分系统(CVSS)分数,以了解漏洞的严重程度。这些信息可以补充到资产数据中,方便专家进行评估。
2. 获取训练数据
为了说明自动化模型参数化的方法,我们构建了一个数据集。考虑一个具有单个父节点的资产,资产状态的转换可能取决于以下属性:
- 当前状态(Curr
逻辑回归参数化与数据准备
超级会员免费看
订阅专栏 解锁全文
1335

被折叠的 条评论
为什么被折叠?



