业界典型的威胁分析方法论有
我们把威胁感知分为两大类:被动威胁感知和主动威胁感知。被动威胁感知,是指根据已知的线索或威胁,还原出整个威胁场景;主动威胁感知,是指通过威胁感知模型,主动发现潜在的威胁或线索。设想一个不现实的场景,假如我们拥有一个能截获全互联网所有流量的系统,那么理论上来说,一切互联网上发生的威胁在这套系统里面都能查得到。但现实是,即便是NSA也不可能获取得到所有的数据,当然也完全没有这个必要。
所以我们需要思考的是,当做不到能获取所有数据的时候,我们需要获取哪些数据?事实上只需要能获取到威胁场景中每条链路上的每个节点的数据,就能覆盖住这次威胁。所以问题的解法就变为,想要感知哪一类威胁,那么就去复盘这一类威胁的所有链路,然后,采集链路上的数据。
数据源的获取永远是个思路问题,很多人一想到采集数据,就觉得一定要到骨干网上去分光,或者是要到海底光缆上去搭线。这是国家级威胁感知的玩法,事实上在公司层面,很多数据平时都是淹没在茫茫业务之下,没人去思考过这些数据在哪以及有什么用。
然而有了数据源还完全不够,没有对应的数据基础设施,数据只是一堆垃圾。数据基础设施不是搭建一套Hadoop、Spark,而是完善的数据生命周期解决方案,从数据诞生、采集、传输、清洗、存储、计算、交互……直至数据消亡。
被动威胁感知
家庭成员称谓数据的生命力更多是体现在数据质量上,而数据质量,恰恰又是整个数据生命周期中最容易被忽视的环节,同时也是最难做好的环节。良好的数据质量,决定了上层的数据建筑,需要持续的投入,不断的观察数据、使用数据、迭代数据。
另外一个更为重要的环节,就是数据交互。情报分析人员如果每次想要分析一条线索都需要启动一个很大的分布式计算任务,计算几个小时才能拿到结果,这一定是一个很差的交互,甚至都谈不上交互。同时,反复的对海量原始数据做重复冗余的提取计算,当计算资源的耗费远超计算结果带来的价值,威胁感知也就失去了意义。
那么,到底什么才是好的数据交互?回答这个问题之前需要搞明白我们之所以需要数据交互,是因为数据的数量或包含的信息量已经超过我们大脑处理能力的负荷。倘若数据只有1
0来条,单条信息量2bit,我们需要交互吗?不需要。所以数据交互第一个重要意义就是帮助我们屏蔽信息的复杂性,让我们更能集中关注我们感兴趣的数据。
自然而然就联系到了搜索,搜索一直是屏蔽信息复杂性最简单也最基本的工具。但在被动威胁感知中,有了搜索也是不够的。其行列式的数据表达仅仅只是数据展示,而可供人机交互的,也只有『搜索』一个按钮,同时,数据与数据之间的关系,也尚不能表达。
回想一下犯罪电影中经常出现的情节,主人公在卧室的墙上贴满了各种线索,再逐个思考线索之间的联系,对于有联系的两个顶点,就加上一条边……直至绘制出整个事件的证据链关系图,找到幕后的大老板。
个人简历的格式
这其实就是一个还原威胁场景的过程,而这当中用到的数据交互,就是简单的connnet the dots。不要小瞧这种基本的图论分析方式,萨达姆被抓,靠的就是社交图论关系链分析。目前估值高达几百亿美金但却只有FBI一个客户的情报公司Palantir,其唯一的产品,靠的还是图论分析。
可以说数据交互的另外一个重要意义,是以正确的方式尽可能呈现数据最真实的一面,帮
十字绣的正确绣法助我们更好的理解数据所要传达的信息。好的数据交互,能让情报分析人员摆脱淹没在海量数据中的困境。当我们不再提海量,不再提数据有多大的时候,才是我们真正具备驾驭数据能力的时候。
自我保护
单一的数据交互就好比高维物体投影在低维空间,因此组合各种不同的交互如和弦、力导向等等能帮助我们从不同的角度来透视高维数据。当然,不同的交互有不同的表达优势,选择恰当的数据交互,需要我们在深入理解交互的同时,也要深入理解业务场景。
线索的追踪和分析,有时候受限于情报分析人员的经验和能力,知识结构的不同,导致每个人看到的可能都是片面化的场景。而分析结果快照、可多人协作机制等这些配套的交互设施,也有助于复杂威胁场景的还原。
可以说,被动威胁感知能力的建设,本质上建设的就是安全数据的基础设施。这绝对是一件知之非难,行之不易的事情,同时也需要很多顶层设计和资源整合。但是如同瓜哥所言,『这件事昨天没有积累今天就不会成功,今天不去积累明天就没有机会』。
主动威胁感知
被动威胁感知加上情报分析人员,让我们具备了看得见整个威胁场景的能力,但是前提条件是要有一条已知的线索或威胁。这就使得我们也需要具备能主动发现线索和威胁的能力,而这,就是主动威胁感知。
在强人工智能尚未实现的年代,别指望有了主动感知能自动完成所有事情自动拼凑出完整的大图。安全的本质依旧还是攻防的对抗,放到威胁感知中也是一样。所以主动感知的定位首先应该是发现浅层次线索,深层挖掘还是需要依赖人来完成,弱人工智能时代永远逃不开有多少人工,才能有多少智能。
通俗来讲,主动威胁感知是一门关于主动寻找你不知道你该寻找什么东西的科学。听起来有点奇怪,想要发现一些线索,却不知道这些线索会长成什么样。在不知道一个威胁是什么的情况下,又怎么能做到感知它的存在呢?
深圳人才引进政策
可以肯定的一点是,任何威胁首先一定是一个异常。所以无论威胁感知模型怎么来建,当中一定要先有一个异常模型。既然是异常模型,首先就需要搞清楚什么是异常。文明礼仪名言名句
关于异常的定义,最早可追溯到1969年,统计学家Grubbs在论文《Procedures for detecting outlying obrvations in samples》中给出了如下的定义:
An outlier is an obrvation point that is distant from other obrvations.
真情玫瑰而现在广为流传的是Hawkins在1980年《Identification of Outliers》一书中给出的定义:晓青老师的丝袜
An outlier as an obrvation that deviates so much from other obrvations as to arou suspicion that it was generated by a different mechanism.