数据驱动安全之旅:技能与挑战的全面剖析
数据获取与分析的常见误区
在数据驱动的安全领域,人们常常会陷入一些误区。其中一个常见的观点是“我们没有数据”,或者认为没有达到精算质量的数据。持这种观点的人觉得不完美的数据毫无价值,会阻碍设计良好的实验。然而,这种看法是错误且有害的。等待完美数据只会让你错失许多学习机会,实际上并不需要完美数据,而是需要从现有杂乱数据中学习的方法。正如Douglas Hubbard所说:“我们往往拥有比想象中更多的数据,需要的数据比想象中更少,通过观察获取更多数据也比想象中简单。”安全分析的数据是存在的,只是等待被收集,即便数据粗略,经过适当处理也能进行准确分析。
另一个需要考虑的问题并非对数据分析的反对,而是数据分析中的障碍,即“我们会掉进世界边缘”。当你被视为领域专家时,人们期望你自信地给出答案,但自信容易与确定性混淆。数据分析需要一定的自我认知和谦逊态度,为怀疑留出空间。例如,虽然你可能自信地认为密码应该有特定长度和复杂度,但实际上并不知道在可用性和安全性之间的平衡在哪里。这种障碍不仅局限于主要分析师,参与分析的其他领域专家也需要面对自己的不足。
编程技能的重要性
数据科学并非如想象中那般光鲜亮丽,处理数据往往充满不确定性和混乱,尤其是在收集和准备数据阶段。数据以各种格式、状态和质量呈现,可能存在于非结构化或半结构化的日志文件中,需要从网站上抓取,甚至可能是复杂的XML格式。要将这些数据收集、整合并转换为适合进一步分析的格式,虽然可以通过耐心、文本编辑器和实习生来完成,但编写脚本会更具功能性、灵活性和效率。
学习基本编程技能能为处理数据带来更多可能性,它让你能够接受多种形式的数据,并将其转换为适合分析软件的格
超级会员免费看
订阅专栏 解锁全文
9

被折叠的 条评论
为什么被折叠?



