7、数据探索与分析:深入了解关键指标

数据探索与SIEM配置优化

数据探索与分析:深入了解关键指标

1. 数据概述

在开始深入分析之前,我们需要对数据有一个基本的了解。以下是数据的一些基本信息:
- 变量类型
- 可靠性(Reliability)、风险(Risk)和 x 为整数类型。
- IP、类型(Type)、国家(Country)、地区(Locale)和坐标(Coords)为字符串类型。
- IP 地址存储格式 :IP 地址以点分十进制格式存储,而非主机名或十进制格式。
- 记录数量 :共有 258,626 条记录,每条记录对应一个唯一的 IP 地址。
- 地理定位信息 :每个 IP 地址都已被地理定位到坐标字段中的经纬度对,但它们存储在一个字段中,以逗号分隔。

2. 定量变量的描述性统计

对于定量变量(即表示数量的数字),一个很好的初步探索步骤是查看变量的基本描述性统计信息。这些统计信息包括:
- 最小值和最大值 :两者之差即为范围(范围 = 最大值 - 最小值)。
- 中位数 :数据集中间的值。
- 第一和第三四分位数 :分别为第 25 和第 75 百分位数,可以看作是数据集前半部分和后半部分的中位数。
- 均值 :所有值的总和除以数量。

以下是使用 R 和 Python 计算可靠性和风险两列描述性统计信息的代码

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值