大数据时代的公安工作初探_周飞

更新时间:2023-04-22 17:27:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

2013年4月 第23卷第2期

上海公安高等专科学校学报Journal of Shanghai Police College

 Apr.,2013 Vol.23 No.2

“大数据”时代的公安工作初探

周 飞,石晋杰,崔 磊

(上海公安高等专科学校, 上海 200137;上海市公安局指挥部, 上海 200042)

摘 要:自2012年以来,“大数据”(Big Data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。对公安工作而言,“大数据”时代的来临,既是挑战,又是机遇。公安机关必须顺应形势发展,从工作思维、顶层设计、信息整合、共享应用、人才保障等方面入手,助推公安工作新发展、新进步。

关键词:“大数据” ; 信息化;公安工作;发展

中图分类号:D631                  文献标识码:A                文章编号:1008-5750(2013)02-0034-(04)DOI: 10.3969/j.issn. 1008-5750.2013.02.007

技术性革命的意义在于,它能改变人们的思维方式和工作模式,成为变革世界的源泉。当前,越来越多的专家学者和学术机构提及“大数据”(Big Data)这一概念,并将与之相关的技术发展与创新,视为继云计算、物联网之后IT产业又一次颠覆性的技术变革,认为其对国家治理模式,对企业的决策、组织和业务流程,对个人生活方式等将产生全方位的影响。国外有媒体预测,2013年将成为“大数据”元年。迈入“大数据”时代,对公安工作而言,既是挑战,又是机遇。积极顺应这股变革的潮流,必将对公安工作产生积极而深远的影响。

算能力的进步,使运算和应用“大数据”成为可能。据统计,计算机数据处理能力提升速度比存储能力提升还要快1倍左右。“云计算”已为计算机运算速度的提升提供了更强大的动力。2011年5月,美国易安信公司(EMC)把其World 2011大会的主题设为“云计算相遇大数据”,正式提出了“大数据”的概念。同年6月,国际数据公司(IDC)发布年度研究报告《从混沌中提取价值》,提出了全球进入“大数据”时代的论断。其依据为:其一,根据IDC过去五年的研究发现,全球数据量大约每两年翻一番;其二,到2010年,全球数据量跨入ZB时代;其三,未来全球数据增速将会维持,预计到2020年全球数据量将达到35ZB。

“大数据”主要是通过虚拟社会和现实社会的人们各类劳动、生产、生活活动而产生的,有如下四个特点:一是数据量的巨大。据IDC统计,2008年全球产生的数据量为0.49ZB,到2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。据预测,到2020年,全世界所产生的数据规模将达到今天的44倍。二是数据的复杂多样。除来源多元外,其自身类型也是多种多样。三是数据价值密度相对较低。因为数据信息海量特征,挖掘“大数据”的价值犹如沙里淘金,如何更迅速地完成数据的价值“提纯”,是“大数据”时代亟待解决的难题。四是处理速度快、时效性要求高。对于“大数据”应用而言,必须在1秒钟内形成答案,否

一、“大数据”时代的特点与影响

(一)“大数据”时代的内涵与特点

目前,“大数据”一般指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经由量变引发质变。即,以往在小规模数据基础上无法完成的事情,在大规模数据的基础上可以奇迹般地得以实现。迈入“大数据”时代有两个明显的标志:一是数据储存能力的进步,使世界能被“数字化”记录。据预测,2013年,人类存储的数据可达3ZB(泽字约相当于普通数据计量单位“千兆字节”的一万亿倍)。更重要的是,数字数据在所有的数据中占98%以上,而2000年数字数据只占所有数据的25%。二是运

收稿日期:2013-03-01   责任编辑:何银松

作者简介:周飞,男,上海公安高等专科学校培训二部主任;石晋杰,男,上海市公安局指挥部研究室干部;

崔磊,男,上海市公安局指挥部研究室干部。

— 34 —

则这些结果可能就是过时的、无效的。比如,立足于“大数据”的股市分析,往往相差几秒就会造成得出的结论过时无用,甚至造成巨大经济损失。

需要说明的是,“大数据”和“云计算”尽管是两个不同的概念,但两者之间有很多交集。全球主要的“云计算”公司,比如谷歌、雅虎、亚马逊等都拥有大量数据。这些公司在构建云基础设施时,就往往会考虑“大数据”的应用。换言之,“大数据”应用必须运行在“云”基础设施上,“大数据”离不开“云计算”。“大数据”应用与“云计算”对基础设施底层的要求是一样的,即规模化、自动化、灵活的资源配置等。

(二)“大数据”时代对思维方式和工作方法的冲击

一是“大数据”分析使社会科学摆脱了对抽样分析的单纯依赖。社会科学中的统计测量方法与几何学定律、物理学万有引力定律一样,都是构建现代文明的基石。在数据收集和处理能力有限的“小数据”时代,统计学家发明了随机采样法,即通过尽可能少的数据获得尽可能接近实际情况的结果。但这种方法存在诸如准确性高度依赖采样随机性、无法满足分类深入分析要求等缺陷。在“大数据”时代下,通过将“样本”扩展到全体数据,不仅可以提高分析的客观准确性,更有条件对数据进行全方位细分和探究,实现对数据的深度利用。二是“大数据”带来明显的效能优势。微软、谷歌等公司科学家在进行“大数据”实验时发现,“大数据”条件下的简单算法比小数据的复杂算法更有效,当数据量达到一定程度后,将带来明显的效能优势。2008年,麻省理工学院的两位经济学家决定抛开政府提供的精确经济数据,改用互联网上数量更多但精确度相对较低的商品信息进行大数据运算,结果在2008年雷曼兄弟破产后马上就发现了通货紧缩趋势,而依赖官方数据进行分析预测的学者直到2个月后才得出相同结论。三是提升了相关关系分析的精度和效率,使“捕捉现在,预测未来”成为可能。相关关系分析是指通过量化分析两个事物之间的数理关系,寻找趋势规律的统计计量方法。在“大数据”时代之前,受制于数据量的限制,相关关系分析的应用很少,效果也很容易受到人为因素的影响。人类可以把数学算法运用到海量数据上,以此来修正人类的偏见和直觉,让“数据说出未来”。近年来,计算机学家、物理学家、数学家、社会学家已经通过无数次实验证明,人类的大部分行为都受制于规律、模型以及原理法则。甚至有美国学者指出,在“大数据”时代,人类93%的行为是可以预测的。

经济全球化进程的加快,全球各地间的联系变得日益紧密,资源网络通达世界每一个角落,通信和交通工具打破了地理的局限,跨地区、跨国流窜犯罪、利用互联网实施的“不在场”犯罪等日益增多;网络谣言、社会矛盾等各种不安定因素大量出现;现代城市的安全软肋日益增多。对此,如何第一时间发现安全隐患和犯罪苗头?如何第一时间锁定对象,实施打击?等等。这都对警务工作提出了新的挑战。而“大数据”无疑为此提供了一条解决之道。

目前,世界很多国家与地区警察部门都在积极应对“大数据”时代的挑战。所谓“情报主导警务”,从某种意义上而言,就是通过对海量的信息积累和分析处理,进而发现相关规律,并据此指导相关警务工作。如香港警务部门通过构建情报信息中心,以海量数据分析弥补传统线人、卧底工作的不足,有效提高了侦查破案和维护社会稳定工作能力,而对中国内地公安机关而言,尽管尚未提出明确“大数据”时代公安工作的发展对策,但随着信息时代、信息技术的发展,公安工作已经踏上了探索“大数据”之路。

(一)“大数据”时代公安工作的发展前景应当看到,十多年的公安信息化建设,为公安工作运用“大数据”提供了强大基础保障;各类数据采集、传输的便捷化,为公安工作开展海量数据分析提供了有力支撑。同时,近年来的相关实践和探索,为公安工作迈入“大数据”时代奠定了扎实的实践基础。为此,我们肯定地说,“大数据”时代的来临,必然会为公安工作带来全新的变革。初步预测,以下几项工作将取得长足进步:

一是“由人到案”侦查能力得到显著提升。“由人到案”侦查模式本身就是一种由情报信息入手,挖掘线索,针对性经营,适时破案打击的综合性侦查工作方式。“大数据”时代的到来,必然为公安机关带来更全面的数据支持。在数据全面的情况下,通过数据比对,以往在大量数据中被淹没的微观细节和异常情况就能显现出来,为“由人到案”的侦查提供大量线索。美国Xoom公司是一个专门从事跨境汇款业务的公司,它在数据公司的支持下对每一笔交易的所有数据进行分析。2011年,它注意到某账户从新泽西州汇款交易量比正常情况多了一些,尽管单独看,每笔交易均合法,但该公司还是启动报警,结果发现这是一个犯罪集团正试图实施诈骗犯罪。

二是预知预警能力得到显著提升。建立在相关关系分析法基础上的预测是“大数据”的核心。美国一些以追踪人类行为为商业模式的公司已经实现了通过分析网络检索词条提前几周预测流感病毒的爆发。其实,预

二、迈入“大数据”时代的公安工作

— 35 —

测突发群体性事件和公共安全事件与预测上述事项并无根本性的差异。在“大数据”时代,有了数据和分析方法,就能预测未来。

三是民意把握能力得到显著提升。要进一步完善民意导向的警务工作机制,首要前提是最大可能地准确把握民意。当前安全感和满意度调查主要采用的是随机抽样分析法,准确度不可避免地受样本局限性的影响。在“大数据”时代,通过尽可能地扩大数据采集来源,全面分析多样化、混杂形的原生态数据,可以更好地排除人为因素的干扰,取得更加客观准确的结果。在此基础上,通过分类分析和趋势分析,可以进一步把握不同人群对公安工作的需求和期望,真正把工作做到老百姓心坎上、把问题解决在老百姓反映前。

(二)“大数据”时代公安机关面临的困难和挑战一是思维观念上尚未与“大数据”时代同步。目前,一些公安机关的领导和民警的思路还停留在传统的数字时代。在数据采集上还是局限在某些限定的数据上,力求精益求精,并以考核的方式加以固定,而忽视了对其它可能的数据的采集,或者根本没有预见到哪些数据可以采集进来为我所用。在数据应用上,常常借助传统的经验,开展个案化的因果分析,分析的效率不高,而且不能把一些新情况的影响纳入分析。

二是信息数据的共享整合程度有待进一步提高。近几年随着公安信息中心建设工作的深化,可利用的信息量大大提升,但地区与地区、部门与部门还不同程度地存在一些信息壁垒,目前在上海公安信息中心整合的几百亿条信息中,社会信息仅占7.3%,难以适应“大数据”时代对数据完整性、混杂性的要求。有时,就因为一些数据的缺失或采集获取不及时,使得一些分析研判工作滞后于实际事态的发展。尤其是政府部门间、各个行业间的数据,出于自身利益的考虑,很多部门(行业)严重忽视国家利益和社会公共安全,对一些完全可以整合的数据搞数据孤岛,与“大数据”时代的要求格格不入。

三是信息处理能力有待提升。在信息处理中,多沿用传统的数据分析工具和分析方法,对于多种格式的数据整合力度不够,数学模型等技术创新不够,难以满足实战的需要。很多数据的处理还只是简单的累加、比对和百分比计算,未能完全满足公安工作的需求,在操作性方面也存在一定的不足。甚至有些数据的处理还依赖人工。如,目前很多地区对视频监控信息的分析,还主要依靠人工观看,工作效率较低。一些已经开发出视频监控软件分析的地区,也没有共享的意识。

四是相关专业人员较为匮乏。“大数据”时代需要大量专业的系统研发、数据挖掘、应用数学、统计计

量、社会心理等方面的专业人才,但这方面专才匮乏。例如,在数学模型等技术创新上,在公安机关内很难见到能够使用数学模型进行数据分析的人才。同时,从近年来的实际情况看,民警队伍信息化应用水平得到了显著的提高,但对于“大数据”的功能和基本应用,大多数还处于懵懂阶段。

三、“大数据”时代公安工作的发展

“大数据”时代公安工作要发展,关键与核心就是提高数据采集和利用的水平。具体来说,可从以下几方面着手:

(一)尽快推动思维和理念的转变

应通过有效的培训和宣传,提升各部门领导和广大民警对“大数据”的认识水平,引导其转变思维方式。主要是树立四个意识:一是树立“大数据”、大采集意识。分析判断不应仅仅满足于案例分析或抽样调查,而应立足“样本=总体”的思路,尽可能采集更多的数据用于分析。二是打破传统的、依靠个人经验和主观臆断来分析判断事物趋势的思维定势,树立用数据“说话”的意识。在具体的分析应用中,不再仅仅满足于简单的数据累加和比较,而应引入关联分析的思路,在数学建模、预警分析等方面大胆尝试。三是树立注意挖掘已有数据内在价值的意识。“大数据”讲究数据分析的速度,但分析是建立在原有数据基础上的,讲究的是对过往数据进行分析,寻找其中的规律,进而预测今后的发展趋势。因此,在注重数据更新的同时,应认真做好已有数据的保存和分析应用。四是树立能够接受误差的意识。“大数据”的分析准确率不可能达到100%,存在一定的误差。而且作为一项新技术、新模式的实践应用,更不可能一蹴而就,但不能因噎废食,而应在不断的探索和实践中予以逐步完善。

(二)研究建立公安“大数据”发展规划

面对海量的“大数据”,建议要从顶层设计入手,在现有信息化建设的基础上,研究制定公安“大数据”发展规划,明确具体任务和发展计划。一是明确数据需求。应从公安机关近几年的工作实践出发,梳理分析公安机关的数据需求,并根据需求的紧迫性,制定近期、中期和远期数据采集计划。二是规划推进公安“云计算”中心建设。目前,现有的数据库软件和系统已经难以适应海量的、形式多样的数据整合和处理要求。对此,应紧跟技术发展趋势,进一步建设能够适应“大数据”应用要求的“云”基础设施,在此基础上建设公安“云计算”中心,从硬件和软件上同步予以加强。三是确立相关研究开发计划。“大数据”的应用,其价值就是根据数据建立一系列的预警指标和数学模型,但是公

— 36 —

安工作内容较多且相互交叉,如果不加规划,就可能造成相关资源的浪费和重复劳动。因此,应从公安工作全局的高度,分门别类,制定相关研究计划,分步予以实施推进,并在实战中不断予以调整和补充。

(三)进一步扩大数据整合共享的覆盖面

数据的占有量直接关系到数据处理的质量。迈入“大数据”时代的公安工作必须在数据积累和共享上下功夫。一是在公安内部打破部门、地域的限制,在安全保密的前提下,开展更大范围内的警务信息的共享。目前,可在区域警务信息共享的基础上,依托公安信息网和相关信息技术,进一步深化区域间警务信息共享。二是进一步强化社会数据的采集和共享。建议提请公安部牵头,加强与各相关部委和行业主管部门联系,研究建立更大范围的社会信息采集和共享机制,必要时积极争取相关立法支持,从法律制度层面进一步打破数据壁垒。可积极借鉴国外警务部门的做法,通过购买的方式,委托一些咨询机构有针对性地开展一些调查研究,并为公安机关采集相关数据。比如,可以委托图书馆信息中心,搜集一定时间段内围绕特定事物的媒体报道信息,为舆情分析和社会情绪监控作参考。三是着力深化国际警务信息共享。可依据相关警务合作机制,与世界各国、各地区警务部门以及国际刑警组织等开展信息共享。建议各地公安机关可在各自的权限范围内与港澳警务部门开展一些试点工作,为公安部的相关工作规划和部署提供参考。

(四)进一步研究提升数据利用水平

“大数据”的关键就是通过对海量数据的“加工”实现数据的“增值”,数据应用水平直接关系到数据“增值”的程度。一是针对海量数据,应改变目前公安业务信息各自存放的情况,以公安信息中心和公安信息网络为依托,继续强化公安信息数据的集中存放,确保

海量的数据能够安全保存、灵活调用。二是进一步整合现有科技力量,并与相关社科机构和IT企业合作,针对不同规格数据的整合和量化、海量数据的自动挖掘和分析等开展研究,研发相关符合公安实战需求,便于民警应用的应用工具。特别是针对目前公安工作的一些紧迫需求,积极开展一些数据分析实践。如,通过对不同社会阶段物价、舆论、失业率、平均工资等相关数据的搜集和比对,研究建立有关社会稳定趋势的数学模型,开展社会稳定情况预测和风险评估;通过对已有犯罪分子的相关信息采集和分析,研究类案人员的心理特征和行为规律,为侦查破案提供借鉴。三是针对美国、英国,以及香港等国家和地区警务部门在“大数据”方面的先行探索和实践开展相关资料及案例搜集研究,组织专业人员进行考察访问和培训交流,积极引入其相关先进经验和技术为我所用。

(五)积极强化专门人才的保障

应从专业人才队伍建设和民警实战应用两方面入手,进一步强化“大数据”时代的专门人才保障。一是积极争取党委、政府的重视和相关部门的支持,通过进一步完善公安科技人才政策,创新用人机制,综合运用行政编制、事业编制和合同聘用等多种用人形式,解决公安科技队伍警力不足,高技术人才“引进难、留住难、发展难”的突出矛盾。同时,与高等院校、科研院所和企业合作,开展各种形式的人员培训,提高公安科技人员的技术水平。“人才引进”和“自我培养”两手并举,打造一支高素质的公安专业数据分析应用技术队伍。二是继续深化科技练兵,将相关数据挖掘和分析技能列入练兵和各警种业务培训内容中,使广大民警真正了解“大数据”时代,熟悉相关系统和工具,并在实践中不断研究新的战法,并提出进一步的修改完善意见,从而发挥“大数据”的最大效能。

Initial Probe into Police Work in the Big Data Era

Zhou Fei, Shi Jinjie, Cui Lei

(Shanghai Police College, Shanghai 200137, China;

Command Centre of Shanghai Municipal Public Security Bureau, Shanghai 200042, China)

Abstract: Since 2012, the term “big data” has frequently been mentioned and used to describe and define the huge amount of data in the information explosive era and to name related technological development and innovation. As to the police work, the coming of big data era is not only a challenge but also an opportunity. Police agencies should go with the tide of development to start with such aspects as work thinking, top design, public information sharing and application and talent provision so as to promote the new development and progress of police work.

Key Words: Big Data; Informatization; Police Work; Development

— 37 —

本文来源:https://www.bwwdw.com/article/qx2q.html

Top