机器学习入门:原理、方法与实践
1. 机器学习带来的思维转变
机器学习促使我们从专注于规则集和特征签名,转向基于计算机直接从数据中学习的持续适应模式。相较于传统的阈值和正则表达式规则,机器学习能带来更灵活、高效的解决方案。
2. 机器学习算法类型
机器学习算法主要分为监督学习和无监督学习两类,选择哪种类型更多取决于数据类型,而非个人偏好。
- 监督学习算法 :训练集需要有已知样本,如判断主机是否感染恶意软件的示例,以及已知各州各县感染情况的数据。只有在拥有标记或已知数据时,才能进行监督学习。
- 无监督学习算法 :适用于事先不知道期望结果的情况,让数据“自我表达”。例如亚马逊或 Netflix 的推荐系统,根据用户的电影租赁或购买历史数据,通过无监督学习技术对相似用户进行分组,从而推荐相关产品。无监督学习有助于发现数据中的分组和关系,进行更深入的探索,但难以用其确定性地证明某些结论。
3. 机器学习能解决的问题
机器学习可以帮助解决以下几类问题:
- 分类 :确定事物所属的类别或应应用的标签。信息安全中的许多战术挑战都围绕分类问题,如判断是否恶意、用户行为是否正常、HTTP 请求是否有效等。分类通常从可能的类别列表和描述这些类别的已知数据开始,属于监督学习算法。
- 定量预测 :机器学习和经典统计学提供了进行定量预测的方法。虽然不能精确预测未来,但可以利用数据进行合理估计。例如,通过线性回归分析,根据人口数量预测 ZeroAccess 感染数量
超级会员免费看
订阅专栏 解锁全文

7231

被折叠的 条评论
为什么被折叠?



