國內(nèi)外反恐系統(tǒng)中大數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀及未來趨勢 2016年09月26日10:39 來源:網(wǎng)易科技|
在進(jìn)入正題之前,我們先來看一個例子:
美國國防部長卡特(AshCarter)曾赴硅谷招募頂尖科技人才。近年來的信息大爆炸使得五角大樓不得不將目光聚焦高科技硅谷,以打擊反恐。美國中央情報局的CTOGusHunt表示,為了提高情報分析能力,他們已經(jīng)加快了運(yùn)用云計算的步伐。
神秘的平臺Palantir就是美國CIA、FBI等尋求的合作對象。Palantir最為人津津樂道的案例有兩個,一是此前美國政府追捕本拉登行動中,Palantir扮演了重要的情報分析的角色;二是Palantir協(xié)助多家銀行追回了納斯達(dá)克前主席麥道夫BernieMadoff所隱藏起來的數(shù)十億美元巨款。
Palantir在洛杉磯警局通過技術(shù)與業(yè)務(wù)的深入交流與合作,采用Palantir的Gotham平臺,構(gòu)建了一-套洛杉磯警局的語義知識搜索挖掘平臺,用于日常的警方業(yè)務(wù)工作中。該平臺全面整合警情日志文檔、電子表格數(shù)據(jù)、數(shù)據(jù)庫等數(shù)據(jù)和電子郵件、文檔、圖片、錄像等非結(jié)構(gòu)化數(shù)據(jù),對各類多源異構(gòu),繁雜的信息進(jìn)行清洗梳理,總結(jié)提煉為八個關(guān)鍵的信息實(shí)體:人、車、位置、罪案、逮捕、文件、備注與其他。實(shí)體本身還有不同的屬性,不同個體之間還存在這相應(yīng)的知識關(guān)聯(lián)。Palantir公安大數(shù)據(jù)語義知識搜索平臺建立以后,警方就可以通過非常簡潔的前端搜索頁面,來搜索指定的各類實(shí)體與線索。
Palantir的搜索結(jié)果與百度等通用搜索引擎完全不一樣,并不完全基于關(guān)鍵詞,而是探索搜索背后的關(guān)聯(lián)關(guān)系,搜索結(jié)果如上圖所示。這里,中間的焦掉是搜索的嫌疑人“MichaelBarton”,通過Palantir平臺,可以快速將各類龐雜的數(shù)據(jù)通過可視化平臺的形式匯聚到一起,最終我們發(fā)現(xiàn)該犯綜合立體化視圖,其中包括:使用的手機(jī),入境記錄,逮捕時開的車,逮捕的案子,同時涉嫌一起案,包括已有的兩次審訊記錄。點(diǎn)擊任何一個節(jié)點(diǎn),右邊會展示其詳細(xì)的屬性與其他實(shí)體的關(guān)聯(lián)關(guān)系。例如,點(diǎn)擊該車,可以展示出該車的歷史所有被抓拍的照片與數(shù)據(jù)。辦案人員同時可以根據(jù)關(guān)聯(lián)連接一層一層往下挖,并人機(jī)互動,補(bǔ)充各種篩選條件,將模糊的破案線索逐步求精,最后極大的提高破案準(zhǔn)確性與效率。
綜合大數(shù)據(jù)的前沿技術(shù)進(jìn)展,可以綜合研判出大數(shù)據(jù)反恐平臺背后的三大關(guān)鍵技術(shù):知識圖譜、大數(shù)據(jù)人機(jī)可視化交互、非結(jié)構(gòu)化精準(zhǔn)搜索與挖掘。分別介紹如下:
知識圖譜
知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),圖中的結(jié)點(diǎn)代表實(shí)體(entity)或者概念(concept),邊代表實(shí)體/概念之間的各種語義關(guān)系。Palantir在圖一中使用的就是知識圖譜的技術(shù),其中嫌疑犯、車、手機(jī)等都節(jié)點(diǎn)屬于知識圖譜中的實(shí)體,而邊就是實(shí)體之間的關(guān)系。知識圖譜允許用戶搜索引擎知道的所有事物、或者地方,而且能夠顯示查詢的實(shí)時信息。知識圖譜技術(shù)表征了公安大數(shù)據(jù)的本質(zhì)語義關(guān)聯(lián),比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫更加自由多樣化,更適合于公安的辦案。
大數(shù)據(jù)人機(jī)可視化交互
運(yùn)用了大數(shù)據(jù)可視化、知識圖譜化、地圖GIS化等手段,同時開放了大量方便的人機(jī)交互接口,實(shí)現(xiàn)了人與機(jī)器的完美融合,也實(shí)現(xiàn)了人與人之間的協(xié)同工作,大大提升了警務(wù)人員掌控數(shù)據(jù)的能力。
非結(jié)構(gòu)化語義精準(zhǔn)搜索與挖掘
非結(jié)構(gòu)化大數(shù)據(jù)指的是文本、圖像與視頻等信息,比傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)的信息量大得多,非結(jié)構(gòu)化語義精準(zhǔn)搜索與挖掘,是指在知識圖譜的基礎(chǔ)上真正理解用戶的搜索請求,不再拘泥于用戶所輸入請求語句的字面本身,而是透過現(xiàn)象看本質(zhì),準(zhǔn)確地捕捉到用戶所輸入語句后面的真正意圖,并以此來進(jìn)行搜索與挖掘,從而更準(zhǔn)確地向用戶返回最符合其需求的搜索結(jié)果。
大數(shù)據(jù)分析工具和技術(shù),結(jié)合文本挖掘、機(jī)器學(xué)習(xí)以及本體建模,已成為進(jìn)行軍事安全威脅預(yù)測、檢測和早期階段預(yù)防的第一道防線。如今大數(shù)據(jù)和數(shù)據(jù)科技,通過改進(jìn)協(xié)作和數(shù)據(jù)分析,減低了情報調(diào)查過程的繁瑣程度,以便機(jī)構(gòu)更輕易地檢測到國家安全威脅。
通過分析恐怖分子日常各種信息,如通話、、購物、交友、電子郵件、聊天記錄、視頻等,對恐怖行為發(fā)生前進(jìn)行預(yù)警和事后分析排查,越來越成為國際預(yù)防反恐的通用手段之一。
責(zé)任編輯:鐘娟娟
上一頁1