本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第1章 ,第1.2节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.2 获取数据分析技能
我们知道数据科学有一种天然的吸引力,每个人都希望获得安全数据分析的奥秘。尽管到目前为止我们一直都专注于数据分析的概念,但要创造每个人都寻找的那种奥秘需要的不仅仅是分析技能,而是需要将可视化技术与统计和数据分析相结合,再利用计算能力和领域(信息安全)知识。所有这一切都不是源于产品或工具,而是自己的技能和能力。
在开始讨论这些技能前,我们要讨论几个从数据分析师身上看到的基本的人格特质:好奇心和沟通。数据工作有时会有点像考古挖掘,花费大量时间,使用小型工具,希望去发现那些甚至是极小的见解。数据分析也是如此,智慧之珠都深藏在数据中,等待被翘首以盼的观众发现。那些充满了惊奇感和好奇感、花费在整理及准备数据的大量时间并不会让人难以忍受,相反,那段时间是令人兴奋、值得花费的。因为存在那一刻,即当你能够在一个原本黑暗的房间里打开一盏灯,当你可以描述一些现象或解释一些模式,当这一切变得值得。这就是你追求的。如果你知道去哪里找,就能发现那些隐藏在众目睽睽之下的惊喜时刻。
一旦你打开了灯,你要带别人进入发现之屋; 否则,你只是建造了一个没有人住的房子。只是指着你的工作,说:“看!”是不够的。你要退一步来思考能够传达你的发现的最好方式。系统和分析的复杂性导致很难以每个人都理解的方式来传达你的发现结果。很多时候,它需要结合文字、数字和图片来传达数据的洞察力。即使是这样,有些人也什么都没有理解,而有些人则会理解过多。但是,仍然有必要将这种复杂性浓缩到段落、表格或图片中。
要描述一个优秀安全数据分析师所需技能的详尽清单需整本书,本章只简述数据科学家从事信息安全数据分析所应具备的技能/领域:
- 领域专业知识,设置和维持一个分析目的。
- 数据管理,能够准备、存储和维护数据。
- 编程技能,将数据连接到分析的纽带。
- 统计学,从数据中学习。
- 可视化,与结果有效沟通。
我们可能很容易将这些技能中的任意一个标注成最重要的,但在现实中,整体大于各部分之和,即每一种技能都对安全数据科学来说举足轻重。