利用大數(shù)據(jù)預(yù)測(cè)犯罪?看洛杉磯警局是如何做到的 2016年09月30日10:16 來源:36大數(shù)據(jù)|
洛杉磯警局與加州大學(xué)洛杉磯分校合作,采集分析了80年來1300萬起犯罪案件,用于進(jìn)行犯罪行為的大型研究,通過算法預(yù)測(cè)成功將相關(guān)區(qū)域的犯罪率降低了36個(gè)百分點(diǎn)。
可見,算法不僅僅可以幫助運(yùn)營人從用戶數(shù)據(jù)挖掘中獲得靈感,同樣,如果不是簡單地分析以往的犯罪規(guī)律,而是采用預(yù)測(cè)式警務(wù)的做法,分析人員就可以利用之前犯罪行為表現(xiàn)出來的規(guī)律,全神貫注地分析下一個(gè)可能發(fā)生犯罪行為的地點(diǎn)并重點(diǎn)干預(yù)。
10年前,在梳理2.45億顧客每周生成的海量數(shù)據(jù)時(shí),沃爾瑪?shù)臄?shù)據(jù)挖掘算法偶然發(fā)現(xiàn)了一條奇怪的信息:在發(fā)布惡劣天氣預(yù)警后,除了管道膠帶、啤酒及瓶裝水等應(yīng)急用品以外,草莓醬餡餅需求量的增長幅度最大。為了驗(yàn)證這一發(fā)現(xiàn),在2004年颶風(fēng)“弗朗西斯”即將襲來的消息發(fā)布后,沃爾瑪超市的管理者下令用卡車裝載家樂氏快餐,運(yùn)送至可能遭受颶風(fēng)襲擊的地區(qū)。結(jié)果,這些快餐很快就被搶購一空。通過這個(gè),沃爾瑪?shù)墓芾碚邔?duì)消費(fèi)者的消費(fèi)習(xí)慣及“公式”的威力有了非常清楚的認(rèn)識(shí)。
認(rèn)識(shí)到這個(gè)發(fā)現(xiàn)具有重要價(jià)值的并不僅僅是沃爾瑪?shù)墓芾韺?。?dāng)時(shí),心理學(xué)家考林·麥庫與洛杉磯警察局長查理·貝克正準(zhǔn)備合寫一篇論文,并向法律實(shí)施方面的雜志《警察局長》投稿。他們以沃爾瑪?shù)倪@個(gè)發(fā)現(xiàn)為契機(jī),對(duì)警務(wù)工作進(jìn)行了再思考,認(rèn)為其要由反應(yīng)式向預(yù)測(cè)式轉(zhuǎn)型。
2009年,他們的這篇題為《預(yù)測(cè)式警務(wù):沃爾瑪及亞馬遜對(duì)打擊經(jīng)濟(jì)衰退期犯罪行為的啟示》的論文一經(jīng)發(fā)表,就立刻引起了美國法律實(shí)施專業(yè)人士的關(guān)注與思考。麥庫與貝克所謂的“預(yù)測(cè)式警務(wù)”,是指由于計(jì)算機(jī)科學(xué)的發(fā)展,犯罪數(shù)據(jù)的收集與分析工作有可能做到“準(zhǔn)實(shí)時(shí)”,因此在將來可用于提高預(yù)測(cè)、預(yù)防和響應(yīng)犯罪行為的效率。借用Quantcast的廣告詞來形容,這意味著警察可以“提前了解、提前行動(dòng)”。
目前,與預(yù)測(cè)式警務(wù)聯(lián)系最緊密的人當(dāng)屬洛杉磯警察局的肖恩·馬林諾夫斯基警官。他被指派協(xié)助威廉·布拉頓局長的工作,先是當(dāng)他的助手,后來成為他的參謀長。從此,馬林諾夫斯基時(shí)來運(yùn)轉(zhuǎn)。在來到洛杉磯之前,布拉頓在紐約市工作。
他只用了幾年時(shí)間,就將紐約市的犯罪率降低到之前的一半,在警界名聲顯赫。布拉頓的工作方法很有效率,但也明顯不循常規(guī)。在到紐約市警察局之前,他還擔(dān)任過紐約警察部門的領(lǐng)導(dǎo)者。在此期間,他首先對(duì)逃票行為予以打擊,把紐約市地鐵系統(tǒng)從一個(gè)犯罪案件頻發(fā)的暴力之地變成了一個(gè)遵紀(jì)守法、安寧整潔、秩序井然的場(chǎng)所。
換句話說,在重大犯罪率創(chuàng)歷史最高紀(jì)錄的時(shí)候,布拉頓首先關(guān)注的是讓人們掏錢買車票。他的理由十分簡單。2009年,他在回憶錄中說,逃票是導(dǎo)致更嚴(yán)重犯罪行為的根源。布拉頓指出:“合法乘客會(huì)認(rèn)為他們身處一個(gè)不講法律、沒有秩序的場(chǎng)所。
他們看到人們不買票就能乘車,便開始懷疑遵紀(jì)守法是否明智。久而久之,整個(gè)社會(huì)就會(huì)陷入一片混亂?!蓖ㄟ^制止并懲處違法行為,甚至連最輕微的犯罪行為也不放過,就會(huì)讓那些制造麻煩的人明白,最好還是掏錢買票,并且把武器(搜查時(shí)通常會(huì)被發(fā)現(xiàn))留在家中。因此,犯罪率開始急劇下降。
來到洛杉磯之后,布拉頓希望繼續(xù)實(shí)施某些先發(fā)制人的手段。馬林諾夫斯基在布萊頓的手下工作了5年,親眼見證了布拉頓單憑意志力就使一個(gè)暮氣沉沉的部門發(fā)生了種種良性的變化。他說:“如果我們所處的機(jī)構(gòu)官僚主義盛行,我們就會(huì)對(duì)遇到的各種阻力習(xí)以為常,而我們的創(chuàng)造力卻會(huì)受到限制。布拉頓告訴我不要受到官僚主義的影響,他還教導(dǎo)我要有遠(yuǎn)大的志向,要有所作為?!?
在工作中,布拉頓最迫切期待的是不斷出現(xiàn)一些可以帶來革命性變化的“奇思妙想”。他認(rèn)為,預(yù)測(cè)性分析可以幫助他實(shí)現(xiàn)這個(gè)愿望。布拉頓發(fā)現(xiàn),犯罪率與數(shù)據(jù)分析的速度之間存在某種聯(lián)系。1990年,警察局一年只能完成一次犯罪數(shù)據(jù)的收集與研究工作,而同一年,美國大多數(shù)城市的犯罪率正在急劇攀升。
到1995年年底,警察局可以做到每月研究一次犯罪數(shù)據(jù),而同期的犯罪率卻有所下降?,F(xiàn)在,他們可以隨時(shí)查看犯罪率情況,因此布拉頓希望通過預(yù)測(cè)可能發(fā)生犯罪行為的地點(diǎn),大幅度降低犯罪率。既然Quantcast和谷歌等公司可以從用戶數(shù)據(jù)挖掘中獲得靈感,同樣,如果不是簡單地分析以往的犯罪規(guī)律,而是采用預(yù)測(cè)式警務(wù)的做法,分析人員就可以利用之前犯罪行為表現(xiàn)出來的規(guī)律,全神貫注地分析下一個(gè)可能發(fā)生犯罪行為的地點(diǎn)。用亞馬遜的話說:“既然你敢偷手提包,難道你就不敢搶酒莊嗎?”
用算法預(yù)測(cè)并制止犯罪行為
眾所周知,在某個(gè)具體區(qū)域內(nèi),犯罪地點(diǎn)并不是隨機(jī)分布的,而是集中于某些小范圍的“熱點(diǎn)地區(qū)”。比如,西雅圖歷時(shí)14年收集的犯罪數(shù)據(jù)表明,有一半的犯罪行為都集中在占該市4.5%的街道上。
明尼蘇達(dá)州明尼阿波利斯市的情況也差不多,半數(shù)電話都來自占該市3.3%的街道。28年間,波士頓市多達(dá)66%的街道案都高度集中于占該市8%的街道。了解這些熱點(diǎn)地區(qū)以及這些地區(qū)可能發(fā)生哪些類型的犯罪行為,對(duì)城市的警力部署具有非常重要的參考價(jià)值。
例如,假設(shè)在我們當(dāng)?shù)氐陌茁咕瓢砷T口,每周六晚上都有人因?qū)嵤┤松砬趾π袨槎徊?。如果我們可以證明這個(gè)假設(shè)是正確的,那么不難預(yù)測(cè)以后的周六晚上在同一地點(diǎn)還會(huì)發(fā)生類似的行為。因此,派一名警官到那里執(zhí)勤,就可以預(yù)防此類惡性事件再次發(fā)生。
在發(fā)現(xiàn)了上述特征之后,布拉頓局長請(qǐng)肖恩·馬林諾夫斯基協(xié)助他做這件事。在接受布拉頓的建議之后,馬林諾夫斯基每個(gè)周五下午都會(huì)開車去加州大學(xué)洛杉磯分校,與該校數(shù)學(xué)系與計(jì)算機(jī)科學(xué)系的人碰頭。
洛杉磯警察局同意提供犯罪統(tǒng)計(jì)數(shù)據(jù)集(該數(shù)據(jù)集非常龐大,收集了80年來約1300萬起犯罪案件的相關(guān)數(shù)據(jù)),用于進(jìn)行犯罪行為的大型研究。馬林諾夫斯基非常享受與加州大學(xué)洛杉磯分校的研究人員一起合作的這段經(jīng)歷。10年前,他在查處酒駕任務(wù)中與警察的第一次合作使他對(duì)警務(wù)工作產(chǎn)生了興趣,而在這次與計(jì)算機(jī)科學(xué)家的合作中,他們梳理數(shù)據(jù)、尋找規(guī)律,并試圖建立某些公式的研究工作,再一次吸引了他。
馬林諾夫斯基回憶說:“我非常喜歡那段經(jīng)歷。”當(dāng)時(shí),一位數(shù)學(xué)家兼計(jì)算機(jī)科學(xué)家的研究讓他產(chǎn)生了濃厚的興趣。這位二十四五歲的年輕人名叫喬治·莫勒,當(dāng)時(shí)正在研究一個(gè)用于預(yù)測(cè)地震危害的算法。在剛聽到莫勒的研究領(lǐng)域時(shí),馬林諾夫斯基以為這與他們當(dāng)時(shí)的研究關(guān)系不大,但后來他發(fā)現(xiàn)自己錯(cuò)了。
地震會(huì)導(dǎo)致余震,而犯罪行為也有同樣的特點(diǎn)。在發(fā)生入室或汽車失竊案之后,短時(shí)間內(nèi)同一地點(diǎn)發(fā)生類似犯罪行為的可能性會(huì)增至之前的4~12倍。這種傳染作用叫作“鄰近重復(fù)”(nearrepeat)效應(yīng)。莫勒解釋說:“搶劫犯常常會(huì)在一周后再次潛入同一住戶或鄰近住戶的家中作案?!?
加州大學(xué)洛杉磯分校的研究小組借鑒了莫勒地震研究的某些成功做法,在人類學(xué)家杰夫·布蘭汀漢姆與犯罪學(xué)家喬治·蒂塔的幫助下,建立了一個(gè)犯罪預(yù)測(cè)算法。他們把洛杉磯市分成單位面積約為0.15平方公里的一個(gè)個(gè)“方塊區(qū)”,然后按照犯罪行為發(fā)生的可能性為這些方塊區(qū)排序。
2011年11月,他們利用該算法開展了一次為期三個(gè)月的隨機(jī)研究。在當(dāng)天的“巡邏待命通知”中,馬林諾夫斯基一開始就明確宣布:“今天是一個(gè)歷史性的日子?!彼诘母惶叵枀^(qū)有拉圖那峽谷、湖景露臺(tái)、帕克伊馬、影子山、太陽谷、桑蘭以及圖洪加7個(gè)主要的巡邏區(qū),被分成共計(jì)5200個(gè)方塊區(qū)。
在當(dāng)天早晨點(diǎn)名時(shí),富特希爾區(qū)的每個(gè)巡邏警察都收到一份任務(wù)地圖,每張地圖上都清楚地標(biāo)示出一個(gè)或多個(gè)方塊區(qū),表明這些地區(qū)是犯罪發(fā)生“可能性高”的區(qū)域。圖上還附有犯罪類型的統(tǒng)計(jì)學(xué)預(yù)測(cè)。馬林諾夫斯基告訴他們:“只要你們有時(shí)間,就深入這些方塊區(qū)巡邏,找出那些可能會(huì)采取犯罪行為的人或預(yù)示著可能會(huì)發(fā)生犯罪案件的狀況,并采取強(qiáng)制或預(yù)防措施,避免犯罪案件發(fā)生?!?
這次實(shí)驗(yàn)一直持續(xù)到第二年的2月。次月,他們對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了評(píng)估,并就是否推廣這項(xiàng)技術(shù)形成了結(jié)論。分析顯示,這項(xiàng)實(shí)驗(yàn)取得了非常顯著的成果。實(shí)驗(yàn)期間,富特希爾區(qū)的犯罪率下降了36個(gè)百分點(diǎn)。在利用算法為巡邏隊(duì)下達(dá)指令的那些天里,算法預(yù)測(cè)犯罪行為的準(zhǔn)確程度是分析人員的兩倍。
喬治·莫勒說:“造成這個(gè)結(jié)果的原因之一是,人腦無法準(zhǔn)確地為全市20個(gè)熱點(diǎn)地區(qū)排序。也許人腦可以找出排在前兩位的熱點(diǎn)地區(qū),但是排完前6位或前7位之后,剩下的只能胡亂猜測(cè)了?!?
這項(xiàng)技術(shù)在推廣之初并非一帆風(fēng)順,其中大部分阻力來自馬林諾夫斯基手下的那些警察。他承認(rèn):“的確,有的警察認(rèn)為自己不需要計(jì)算機(jī)來告訴他們哪里有可能會(huì)發(fā)生犯罪行為。
很多家伙都抵制這種做法,即使告訴他們計(jì)算機(jī)的預(yù)測(cè)結(jié)果,他們也會(huì)說:“我早就知道范納伊斯與格倫奧克斯的交界處是一個(gè)麻煩之地?!谑俏覇査麄儯骸@個(gè)地方一直讓我們頭疼,對(duì)嗎?那你們?cè)谶@里工作多久了?’他們說:‘我們?cè)谶@個(gè)地方已經(jīng)工作10年了?!医又f:‘既然10年前你們就知道這個(gè)事實(shí),為什么這個(gè)問題至今沒有解決呢?別廢話了,趕緊去那里把這個(gè)問題解決掉?!?/p>
責(zé)任編輯:鐘娟娟
上一頁1