网络研究中的统计方法:基础、应用与展望
1. 引言
网络威胁难以预测、衡量和管理,在复杂的网络空间中获取所有网络相关数据几乎是不可能的挑战。网络威胁具有快速变化、无边界、随机的特点,收集到的网络活动观测数据往往模糊或不完整。随着技术的进步,网络攻击的频率和影响程度都在不断增加。例如,2007 年的一项研究表明黑客平均每 39 秒发动一次攻击,即每天 2244 次;2018 年,美国联邦调查局(FBI)的互联网犯罪投诉中心(IC3)收到 351,937 起投诉,网络攻击造成了 27 亿美元的财务损失。
统计学作为数学科学的一个分支,涉及数据的收集、分析和解释。尽管准确的网络事件信息往往难以获取,但统计学已广泛应用于网络安全威胁、网络犯罪、网络攻击等相关网络应用的研究中。统计学可以将观测数据转化为大众知识,帮助我们从数据中学习、避免得出不当结论,同时也有助于重新评估他人分析的质量。
2. 统计学的基本要素
2.1 组织、性质和特征
统计学通常可分为描述性统计和推断性统计两大分支。描述性统计用于组织、总结和描述原始观测数据,使其成为大众能够理解、关联或共享的信息;推断性统计则是通过小数据集(样本数据)对更大数据集(总体数据)进行推断或得出结论。此外,概率也是统计学的一个分支,它使用 0(不可能)到 1(确定)的数值尺度来估计未来事件的可能性。
统计学中有一些基本术语:
- 总体:是研究的目标、问题或主题,通常表示为更广泛的数据集,是抽取统计样本的整个数据池。
- 样本:是总体的子集,通常用较小的数据集表示,通过各种抽样方法从总体中抽取,常见的抽样方法有随机抽样和聚类抽样。
- 变量:是总体
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



