利用大數(shù)據(jù)預(yù)測犯罪?看洛杉磯警局是如何做到的 2016年09月30日10:16 來源:36大數(shù)據(jù)|
洛杉磯警局與加州大學(xué)洛杉磯分校合作,采集分析了80年來1300萬起犯罪案件,用于進行犯罪行為的大型研究,通過算法預(yù)測成功將相關(guān)區(qū)域的犯罪率降低了36個百分點。
可見,算法不僅僅可以幫助運營人從用戶數(shù)據(jù)挖掘中獲得靈感,同樣,如果不是簡單地分析以往的犯罪規(guī)律,而是采用預(yù)測式警務(wù)的做法,分析人員就可以利用之前犯罪行為表現(xiàn)出來的規(guī)律,全神貫注地分析下一個可能發(fā)生犯罪行為的地點并重點干預(yù)。
10年前,在梳理2.45億顧客每周生成的海量數(shù)據(jù)時,沃爾瑪?shù)臄?shù)據(jù)挖掘算法偶然發(fā)現(xiàn)了一條奇怪的信息:在發(fā)布惡劣天氣預(yù)警后,除了管道膠帶、啤酒及瓶裝水等應(yīng)急用品以外,草莓醬餡餅需求量的增長幅度最大。為了驗證這一發(fā)現(xiàn),在2004年颶風(fēng)“弗朗西斯”即將襲來的消息發(fā)布后,沃爾瑪超市的管理者下令用卡車裝載家樂氏快餐,運送至可能遭受颶風(fēng)襲擊的地區(qū)。結(jié)果,這些快餐很快就被搶購一空。通過這個,沃爾瑪?shù)墓芾碚邔οM者的消費習(xí)慣及“公式”的威力有了非常清楚的認識。
認識到這個發(fā)現(xiàn)具有重要價值的并不僅僅是沃爾瑪?shù)墓芾韺印.敃r,心理學(xué)家考林·麥庫與洛杉磯警察局長查理·貝克正準備合寫一篇論文,并向法律實施方面的雜志《警察局長》投稿。他們以沃爾瑪?shù)倪@個發(fā)現(xiàn)為契機,對警務(wù)工作進行了再思考,認為其要由反應(yīng)式向預(yù)測式轉(zhuǎn)型。
2009年,他們的這篇題為《預(yù)測式警務(wù):沃爾瑪及亞馬遜對打擊經(jīng)濟衰退期犯罪行為的啟示》的論文一經(jīng)發(fā)表,就立刻引起了美國法律實施專業(yè)人士的關(guān)注與思考。麥庫與貝克所謂的“預(yù)測式警務(wù)”,是指由于計算機科學(xué)的發(fā)展,犯罪數(shù)據(jù)的收集與分析工作有可能做到“準實時”,因此在將來可用于提高預(yù)測、預(yù)防和響應(yīng)犯罪行為的效率。借用Quantcast的廣告詞來形容,這意味著警察可以“提前了解、提前行動”。
目前,與預(yù)測式警務(wù)聯(lián)系最緊密的人當屬洛杉磯警察局的肖恩·馬林諾夫斯基警官。他被指派協(xié)助威廉·布拉頓局長的工作,先是當他的助手,后來成為他的參謀長。從此,馬林諾夫斯基時來運轉(zhuǎn)。在來到洛杉磯之前,布拉頓在紐約市工作。
他只用了幾年時間,就將紐約市的犯罪率降低到之前的一半,在警界名聲顯赫。布拉頓的工作方法很有效率,但也明顯不循常規(guī)。在到紐約市警察局之前,他還擔任過紐約警察部門的領(lǐng)導(dǎo)者。在此期間,他首先對逃票行為予以打擊,把紐約市地鐵系統(tǒng)從一個犯罪案件頻發(fā)的暴力之地變成了一個遵紀守法、安寧整潔、秩序井然的場所。
換句話說,在重大犯罪率創(chuàng)歷史最高紀錄的時候,布拉頓首先關(guān)注的是讓人們掏錢買車票。他的理由十分簡單。2009年,他在回憶錄中說,逃票是導(dǎo)致更嚴重犯罪行為的根源。布拉頓指出:“合法乘客會認為他們身處一個不講法律、沒有秩序的場所。
他們看到人們不買票就能乘車,便開始懷疑遵紀守法是否明智。久而久之,整個社會就會陷入一片混亂?!蓖ㄟ^制止并懲處違法行為,甚至連最輕微的犯罪行為也不放過,就會讓那些制造麻煩的人明白,最好還是掏錢買票,并且把武器(搜查時通常會被發(fā)現(xiàn))留在家中。因此,犯罪率開始急劇下降。
來到洛杉磯之后,布拉頓希望繼續(xù)實施某些先發(fā)制人的手段。馬林諾夫斯基在布萊頓的手下工作了5年,親眼見證了布拉頓單憑意志力就使一個暮氣沉沉的部門發(fā)生了種種良性的變化。他說:“如果我們所處的機構(gòu)官僚主義盛行,我們就會對遇到的各種阻力習(xí)以為常,而我們的創(chuàng)造力卻會受到限制。布拉頓告訴我不要受到官僚主義的影響,他還教導(dǎo)我要有遠大的志向,要有所作為?!?
在工作中,布拉頓最迫切期待的是不斷出現(xiàn)一些可以帶來革命性變化的“奇思妙想”。他認為,預(yù)測性分析可以幫助他實現(xiàn)這個愿望。布拉頓發(fā)現(xiàn),犯罪率與數(shù)據(jù)分析的速度之間存在某種聯(lián)系。1990年,警察局一年只能完成一次犯罪數(shù)據(jù)的收集與研究工作,而同一年,美國大多數(shù)城市的犯罪率正在急劇攀升。
到1995年年底,警察局可以做到每月研究一次犯罪數(shù)據(jù),而同期的犯罪率卻有所下降?,F(xiàn)在,他們可以隨時查看犯罪率情況,因此布拉頓希望通過預(yù)測可能發(fā)生犯罪行為的地點,大幅度降低犯罪率。既然Quantcast和谷歌等公司可以從用戶數(shù)據(jù)挖掘中獲得靈感,同樣,如果不是簡單地分析以往的犯罪規(guī)律,而是采用預(yù)測式警務(wù)的做法,分析人員就可以利用之前犯罪行為表現(xiàn)出來的規(guī)律,全神貫注地分析下一個可能發(fā)生犯罪行為的地點。用亞馬遜的話說:“既然你敢偷手提包,難道你就不敢搶酒莊嗎?”
用算法預(yù)測并制止犯罪行為
眾所周知,在某個具體區(qū)域內(nèi),犯罪地點并不是隨機分布的,而是集中于某些小范圍的“熱點地區(qū)”。比如,西雅圖歷時14年收集的犯罪數(shù)據(jù)表明,有一半的犯罪行為都集中在占該市4.5%的街道上。
明尼蘇達州明尼阿波利斯市的情況也差不多,半數(shù)電話都來自占該市3.3%的街道。28年間,波士頓市多達66%的街道案都高度集中于占該市8%的街道。了解這些熱點地區(qū)以及這些地區(qū)可能發(fā)生哪些類型的犯罪行為,對城市的警力部署具有非常重要的參考價值。
例如,假設(shè)在我們當?shù)氐陌茁咕瓢砷T口,每周六晚上都有人因?qū)嵤┤松砬趾π袨槎徊?。如果我們可以證明這個假設(shè)是正確的,那么不難預(yù)測以后的周六晚上在同一地點還會發(fā)生類似的行為。因此,派一名警官到那里執(zhí)勤,就可以預(yù)防此類惡性事件再次發(fā)生。
在發(fā)現(xiàn)了上述特征之后,布拉頓局長請肖恩·馬林諾夫斯基協(xié)助他做這件事。在接受布拉頓的建議之后,馬林諾夫斯基每個周五下午都會開車去加州大學(xué)洛杉磯分校,與該校數(shù)學(xué)系與計算機科學(xué)系的人碰頭。
洛杉磯警察局同意提供犯罪統(tǒng)計數(shù)據(jù)集(該數(shù)據(jù)集非常龐大,收集了80年來約1300萬起犯罪案件的相關(guān)數(shù)據(jù)),用于進行犯罪行為的大型研究。馬林諾夫斯基非常享受與加州大學(xué)洛杉磯分校的研究人員一起合作的這段經(jīng)歷。10年前,他在查處酒駕任務(wù)中與警察的第一次合作使他對警務(wù)工作產(chǎn)生了興趣,而在這次與計算機科學(xué)家的合作中,他們梳理數(shù)據(jù)、尋找規(guī)律,并試圖建立某些公式的研究工作,再一次吸引了他。
馬林諾夫斯基回憶說:“我非常喜歡那段經(jīng)歷?!碑敃r,一位數(shù)學(xué)家兼計算機科學(xué)家的研究讓他產(chǎn)生了濃厚的興趣。這位二十四五歲的年輕人名叫喬治·莫勒,當時正在研究一個用于預(yù)測地震危害的算法。在剛聽到莫勒的研究領(lǐng)域時,馬林諾夫斯基以為這與他們當時的研究關(guān)系不大,但后來他發(fā)現(xiàn)自己錯了。
地震會導(dǎo)致余震,而犯罪行為也有同樣的特點。在發(fā)生入室或汽車失竊案之后,短時間內(nèi)同一地點發(fā)生類似犯罪行為的可能性會增至之前的4~12倍。這種傳染作用叫作“鄰近重復(fù)”(nearrepeat)效應(yīng)。莫勒解釋說:“搶劫犯常常會在一周后再次潛入同一住戶或鄰近住戶的家中作案?!?
加州大學(xué)洛杉磯分校的研究小組借鑒了莫勒地震研究的某些成功做法,在人類學(xué)家杰夫·布蘭汀漢姆與犯罪學(xué)家喬治·蒂塔的幫助下,建立了一個犯罪預(yù)測算法。他們把洛杉磯市分成單位面積約為0.15平方公里的一個個“方塊區(qū)”,然后按照犯罪行為發(fā)生的可能性為這些方塊區(qū)排序。
2011年11月,他們利用該算法開展了一次為期三個月的隨機研究。在當天的“巡邏待命通知”中,馬林諾夫斯基一開始就明確宣布:“今天是一個歷史性的日子?!彼诘母惶叵枀^(qū)有拉圖那峽谷、湖景露臺、帕克伊馬、影子山、太陽谷、桑蘭以及圖洪加7個主要的巡邏區(qū),被分成共計5200個方塊區(qū)。
在當天早晨點名時,富特希爾區(qū)的每個巡邏警察都收到一份任務(wù)地圖,每張地圖上都清楚地標示出一個或多個方塊區(qū),表明這些地區(qū)是犯罪發(fā)生“可能性高”的區(qū)域。圖上還附有犯罪類型的統(tǒng)計學(xué)預(yù)測。馬林諾夫斯基告訴他們:“只要你們有時間,就深入這些方塊區(qū)巡邏,找出那些可能會采取犯罪行為的人或預(yù)示著可能會發(fā)生犯罪案件的狀況,并采取強制或預(yù)防措施,避免犯罪案件發(fā)生。”
這次實驗一直持續(xù)到第二年的2月。次月,他們對實驗結(jié)果進行了評估,并就是否推廣這項技術(shù)形成了結(jié)論。分析顯示,這項實驗取得了非常顯著的成果。實驗期間,富特希爾區(qū)的犯罪率下降了36個百分點。在利用算法為巡邏隊下達指令的那些天里,算法預(yù)測犯罪行為的準確程度是分析人員的兩倍。
喬治·莫勒說:“造成這個結(jié)果的原因之一是,人腦無法準確地為全市20個熱點地區(qū)排序。也許人腦可以找出排在前兩位的熱點地區(qū),但是排完前6位或前7位之后,剩下的只能胡亂猜測了?!?
這項技術(shù)在推廣之初并非一帆風(fēng)順,其中大部分阻力來自馬林諾夫斯基手下的那些警察。他承認:“的確,有的警察認為自己不需要計算機來告訴他們哪里有可能會發(fā)生犯罪行為。
很多家伙都抵制這種做法,即使告訴他們計算機的預(yù)測結(jié)果,他們也會說:“我早就知道范納伊斯與格倫奧克斯的交界處是一個麻煩之地。’于是我問他們:‘這個地方一直讓我們頭疼,對嗎?那你們在這里工作多久了?’他們說:‘我們在這個地方已經(jīng)工作10年了?!医又f:‘既然10年前你們就知道這個事實,為什么這個問題至今沒有解決呢?別廢話了,趕緊去那里把這個問題解決掉?!?/p>
責(zé)任編輯:鐘娟娟
上一頁1