大數(shù)據(jù)時(shí)代下的意圖搜索 個(gè)性化服務(wù)是關(guān)鍵 2016年09月28日08:46 來(lái)源:信息與電子前沿|
意圖搜索起源于互聯(lián)網(wǎng)搜索引擎,是基于互聯(lián)網(wǎng)上海量的無(wú)組織、異構(gòu)、動(dòng)態(tài)的數(shù)據(jù)與信息環(huán)境下搜索引擎不能準(zhǔn)確理解用戶(hù)的搜索意圖而提出的,利用如神經(jīng)網(wǎng)絡(luò)算法等機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)智能化的自動(dòng)搜索,從而更加精準(zhǔn)、主體的提供個(gè)性化的服務(wù)。
時(shí)代下的意圖搜索個(gè)性化服務(wù)是關(guān)鍵
一、目的意義
大數(shù)據(jù)時(shí)代,任何網(wǎng)絡(luò)行為所留下的“蛛絲馬跡”都以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,正所謂“存在就有痕跡,聯(lián)系就有信息”,通過(guò)應(yīng)用物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù),構(gòu)建網(wǎng)絡(luò)空間中行為事件、思想事件等模型。在實(shí)體空間和虛擬空間中全面收集、甄別、過(guò)濾、分類(lèi)、整合人的存在痕跡和聯(lián)系信息,關(guān)注或事件間聯(lián)系鏈,從而實(shí)現(xiàn)網(wǎng)絡(luò)空間中存在的各種意圖,完成對(duì)意圖產(chǎn)生源頭、傳播途徑和發(fā)展趨勢(shì)的全方位描述,達(dá)到對(duì)個(gè)人和組織的所思所想行為所在的全面搜索和分析。做到提前預(yù)警、智能決策。
2013年的“棱鏡門(mén)”事件為國(guó)家安全敲響警鐘的同時(shí)我們也看到正是有了“大數(shù)據(jù)”的存在,才讓“棱鏡”項(xiàng)目得以實(shí)施。目前,我國(guó)面臨的安全形勢(shì)嚴(yán)峻,反恐問(wèn)題更是當(dāng)前國(guó)際面臨的重要安全問(wèn)題,大數(shù)據(jù)環(huán)境下的意圖搜索將能積極應(yīng)對(duì)新時(shí)期各種安全威脅,運(yùn)用大數(shù)據(jù)技術(shù)和人工智能技術(shù)進(jìn)行深入分析,實(shí)現(xiàn)對(duì)安全事件的準(zhǔn)確識(shí)別和提前預(yù)警,有力提升我國(guó)基于大數(shù)據(jù)的國(guó)家安全防護(hù)能力。
二、關(guān)鍵技術(shù)
1、人工智能技術(shù):意圖搜索引擎構(gòu)建了人與信息的意識(shí)主動(dòng)化的連接,通過(guò)不斷的交換學(xué)習(xí),形成模擬人腦的智能系統(tǒng),從而實(shí)現(xiàn)人與機(jī)器的相互了解,因此人工智能技術(shù)將是意圖所搜的核心技術(shù)。主要相關(guān)的人工智能技術(shù)有:機(jī)器深度學(xué)習(xí)、計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)、腦機(jī)接口、自然語(yǔ)言處理等技術(shù)。
2、大數(shù)據(jù)技術(shù):而對(duì)數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、處理、挖掘分析是搜索技術(shù)的基本環(huán)節(jié),因此以數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘等技術(shù)為主的大數(shù)據(jù)技術(shù)也是意圖搜索的關(guān)鍵技術(shù)之一。主要相關(guān)的大數(shù)據(jù)技術(shù)有:數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)挖掘與分析技術(shù)等。
3、物聯(lián)網(wǎng)技術(shù):隨著傳感器的發(fā)展和移動(dòng)化的能力,意圖搜索也呈現(xiàn)多樣化的形態(tài)。因此,以傳感器技術(shù)為主的物聯(lián)網(wǎng)技術(shù)也是意圖搜索的關(guān)鍵技術(shù)之一。
4、其他信息技術(shù):此外,搜索實(shí)現(xiàn)從傳統(tǒng)搜索到人工智能的過(guò)渡,還需要分詞技術(shù)、硬件存儲(chǔ)、云計(jì)算、超級(jí)計(jì)算、知識(shí)圖譜等相關(guān)技術(shù)的成熟。
三、目標(biāo)成果
大數(shù)據(jù)環(huán)境下的意圖搜索技術(shù)將是構(gòu)建一個(gè)構(gòu)建虛擬空間信息社會(huì)雷達(dá)系統(tǒng)。該系統(tǒng)的主體是搭建一個(gè)完整的知識(shí)庫(kù),開(kāi)發(fā)意圖搜索引擎系統(tǒng)、并構(gòu)建云計(jì)算與大數(shù)據(jù)的基礎(chǔ)設(shè)施平臺(tái)。
搜索引擎系統(tǒng):搜集器、控制器、索引器、檢索器、用戶(hù)接口、處理分析系統(tǒng)
技術(shù)成果:人工智能、智能推理及知識(shí)研發(fā)、信息提取與分析技術(shù)、虛擬化工具、系統(tǒng)運(yùn)行保障研發(fā)、系統(tǒng)算法、信息檢索能力研發(fā)等技術(shù)上的突破成果。
四、國(guó)內(nèi)外狀況
1、美國(guó)
(1)美國(guó)技術(shù)優(yōu)勢(shì)明顯
以微軟和Google為代表的互聯(lián)網(wǎng)巨頭技術(shù)和應(yīng)用皆處于領(lǐng)先地位。微軟亞洲研究院的人立方關(guān)系搜索提供的搜索結(jié)果中,將所有信息都按照“人”進(jìn)行重新整合,以人與人之間的關(guān)系為紐帶,將埋藏在海洋中的“人”的信息連接匯總,圖文并茂地展現(xiàn)出來(lái),開(kāi)啟的意圖搜索的新篇章。棱鏡門(mén)事件以來(lái),NSA的全球監(jiān)控行為遭到各國(guó)政府和人民的譴責(zé),但美國(guó)情報(bào)部門(mén)所展現(xiàn)的大數(shù)據(jù)和技術(shù)實(shí)力不容忽視。Accumulo數(shù)據(jù)庫(kù)系統(tǒng)是NSA企業(yè)架構(gòu)的核心。大多數(shù)NSA的關(guān)鍵分析應(yīng)用都運(yùn)行在Accumulo上,從技術(shù)角度看,NSA已經(jīng)能夠識(shí)別網(wǎng)絡(luò)上的各種可疑行為和個(gè)人,可以說(shuō)美國(guó)政府在相關(guān)技術(shù)已走到了Google、微軟等互聯(lián)網(wǎng)巨頭之前。
(2)政府支持力度大
美國(guó)在相關(guān)技術(shù)的研發(fā)上給予高度重視。奧巴馬政府大數(shù)據(jù)研究和發(fā)展倡議中推出的XDATA項(xiàng)目將在四年里耗費(fèi)2500萬(wàn)美元來(lái)開(kāi)發(fā)計(jì)算技術(shù)和防護(hù)數(shù)據(jù)軟件。2014年美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)啟動(dòng)其“大機(jī)理”項(xiàng)目,目的是發(fā)展可以發(fā)現(xiàn)隱藏在大數(shù)據(jù)中的因果關(guān)系模型。美國(guó)國(guó)防部每年投入2.5億美元資助利用海量數(shù)據(jù)的新方法研究,并將傳感、感知和決策支持結(jié)合在一起,制造能自己運(yùn)行和做出決策的自治系統(tǒng),為軍事行動(dòng)提供更好的支持。NSA在大數(shù)據(jù)項(xiàng)目的規(guī)模、可擴(kuò)展性、安全性在很多方面甚至超過(guò)了Google、亞馬遜和蘋(píng)果這樣的大型互聯(lián)網(wǎng)企業(yè)。NSA旗下的風(fēng)險(xiǎn)投資In-Q-Tel迄今已經(jīng)投資了200多個(gè)云計(jì)算、大數(shù)據(jù)、搜索與分析創(chuàng)業(yè)項(xiàng)目。美國(guó)國(guó)土安全部正在開(kāi)展“可視化和數(shù)據(jù)分析卓越中心”項(xiàng)目,通過(guò)對(duì)大規(guī)模異構(gòu)數(shù)據(jù)的研究,使應(yīng)急救援人員能夠解決人為或自然災(zāi)害、恐怖主義事件、網(wǎng)絡(luò)威脅等方面的問(wèn)題。
(3)美軍利用大數(shù)據(jù)搜索提升偵查和反恐能力
美軍正在開(kāi)發(fā)的新一代大數(shù)據(jù)系統(tǒng),能夠通過(guò)計(jì)算機(jī)的速度和精度以及人的敏捷性,來(lái)理解和解釋現(xiàn)實(shí)世界,協(xié)助指揮官和分析人員將以100倍于當(dāng)前的速度來(lái)理解傳感器收集的海量數(shù)據(jù)。例如,當(dāng)阿富汗境內(nèi)的大毒梟準(zhǔn)備為基地組織等恐怖分子提供資金時(shí),美軍的情報(bào)分析人員能夠借助大數(shù)據(jù)技術(shù),把作戰(zhàn)方案庫(kù)里的數(shù)據(jù)與有關(guān)基地組織情況庫(kù)里的資金數(shù)據(jù)進(jìn)行實(shí)時(shí)、自主關(guān)聯(lián),指導(dǎo)美軍先敵一步采取行動(dòng)。
在美國(guó)國(guó)防部的資助下,美國(guó)“記錄未來(lái)”公司,專(zhuān)門(mén)研究如何通過(guò)分析互聯(lián)網(wǎng)信息,特別是“臉譜”、“推特”等社交網(wǎng)站,預(yù)先察知恐怖襲擊等重大事件。2013年6月,美國(guó)國(guó)家安全局局長(zhǎng)兼美國(guó)賽博司令部司令亞歷山大在參加眾議院特設(shè)情報(bào)委員會(huì)聽(tīng)證會(huì)時(shí)承認(rèn),通過(guò)秘密進(jìn)行的“棱鏡”等項(xiàng)目,美國(guó)政府至少挫敗了50起恐怖襲擊事件。這是大數(shù)據(jù)技術(shù)運(yùn)用的成功。
2、我國(guó)的發(fā)展現(xiàn)狀
在我國(guó)百度、搜狗、360等互聯(lián)網(wǎng)公司以及等安防企業(yè)處于技術(shù)和應(yīng)用的前沿。從整體上來(lái)看,在商業(yè)開(kāi)放和應(yīng)用方面尚具備一定的國(guó)際競(jìng)爭(zhēng)力,但從大數(shù)據(jù)智能搜索應(yīng)用于國(guó)家安全防護(hù)上來(lái)看,我國(guó)在此方面與美國(guó)尚存在著較大的差距。
責(zé)任編輯:黎晉