数据驱动安全分析:技能、问题与工具
一、可视化与沟通
可视化本质上是一种沟通方式。可视化类型可大致分为两类,区分依据是受众不同:
1. 为自己可视化 :例如 R 语言的 lm() 函数自动生成的四个常见绘图,用于诊断线性回归模型的拟合情况。这些图除非你学会如何解读,否则既不美观又容易让人困惑,不会用于向董事会展示。它们是分析师在处理数据或分析数据模型时获取信息的工具,重点在于理解数据关系和属性,不注重美观和展示性。
2. 为他人可视化 :这类可视化用于分析师向他人传达信息,解释从数据中发现的故事。通常需要具有吸引力且传达清晰的信息,是面向非分析师的沟通工具。比如从与上述相同数据衍生而来的图,更简洁,能让读者从图中获取每个大陆州的相关信息。
在数据分析中,可将不同技能组合使用,使分析更顺畅,提升从数据中获取知识的能力。随着数据增多和分析需求融入文化,可让多人分担工作。组建安全数据科学团队时,不必要求一人具备所有技能,应与候选人沟通,确保他们至少具备部分相关技能。
二、以问题为核心
2.1 问题的重要性
数据分析并非为了分析而分析,而是在更大的背景下进行,理解这个背景是成功分析的关键。一个好的数据分析项目应从设定目标和提出研究问题开始。如果缺乏精心准备的研究问题,可能会让人觉得分析结果无关紧要。
例如,展示某组织一个月内拦截的垃圾邮件数量和类别,虽然能通过邮件过滤系统日志收集和展示这些信息,但对大多数组织来说,这些数据所回答的问题及可能引发的后续行动并无太大意义。而一个好的关于垃圾邮件的研究问
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



