
美国兰德公司于2018年5月发布报告《定义国防业界(defense enterprise)第二代开源情报》,提出了第二代开源情报(OSINT)产生的背景与基本定义,并在国防业界的框架下阐述了第二代开源情报的内容分类、操作周期、使用工具、分析方法、发展趋势及未来展望。该报告论述了开源情报的优势与劣势,进而引发关于开源情报的几点思考与启示。
兰德公司报告的主要内容
第二代开源情报的产生背景与基本定义。随着互联网的日益普及、社交媒体和大数据分析的迅速发展,利用开源情报来获取信息的程度大大加深,信息的来源和处理方法日趋复杂,数据的数量和类型逐步拓宽,开源情报本身发生了重大转型。美国家情报总监(DNI)办公室曾于2011年将开源情报定义为“将公开数据和信息进行搜集、利用、分发,用来满足特定用户需求的情报”。鉴于公开情报的性质不断变化,该报告建议将当前时期开源情报的发展过程定义为第二代开源情报,并把起始时间追溯至情报界创建开源中心的2005年。这一年,脸书(Facebook)及油管(YouTube)的相继问世,以及2006年推特(Twitter)的成立,使得大部分在线内容越来越多地源自于互联网站、个人账户及社交媒体。由此推测,新一代开源情报活动是种需要多学科、多领域、多人员交织融合的情报工作,旨在给情报界及国防业界带来更多有新意、有价值的信息与知识。
第二代开源情报的内容分类与操作周期。从纷繁复杂的海量信息中识别其价值的重要性不言而喻,为了能够更好地将开源信息加以整合利用,兰德公司将第二代开源情报分为四种类型,即新闻媒体、灰色文献、长篇社交媒体内容和短篇社交媒体内容。其中,新闻媒体和灰色文献属于机构生成内容,长篇社交媒体信息和短篇社交媒体信息属于个人生成内容。开源情报的搜集范围之广、内容体量之大由此可见一斑。
此外,兰德公司还将开源情报的操作周期分为收集、处理、开发和生产四个步骤。其中,收集是指针对开源信息的获取,处理是指检验开源信息的方法,开发是指识别开源信息的价值,生产是指将有价值的信息提供给用户。
一是收集,指的是识别潜在的、有用的信息并保留上述材料。新闻媒体和灰色文献的收集相对容易,大多数内容都可在线获得,相比之下,社交媒体信息在收集阶段就要面对很多挑战。首先,社交媒体信息可能很难获得完整的、原始的数据和图片,即使能够获得完整的数据和图片,也不能作为群体样本来进行参考;其次,由于社交媒体数据能够轻易地包含民众的信息,情报机构必须遵循与搜集和存储信息有关的严格程序。
二是处理,指的是甄别信息后将其进行翻译与整合,主要用来分析多类型的社交媒体信息。处理可以采取多种形式,包括将原文进行翻译,或将图片和视频整合为可用的材料。在处理过程中,可以使用相应的软件和程序,以更便捷的方法和更低廉的成本来完成工作内容。但与此同时,开源信息中各种俚语、表情符号或图标的使用频率越来越高,这也在一定程度上加大了处理难度。
三是开发,指的是鉴定、评估可信性以及编写成文。鉴定需要证实信息的实际情况是否如其所说;评估可信性需要判断所掌握信息的真实程度;编写成文需要将搜集的材料整合成完整、有序的内容。

