在采用大數(shù)據(jù)策略方面,雖然私營部門發(fā)揮了模范帶頭作用,但公共部門也做出了不少成績。本文列舉了美國聯(lián)邦機構(gòu)和地方政府機構(gòu)制定和運用大數(shù)據(jù)策略的幾個例子,涵蓋欺詐檢測、金融市場分析、健康研究、政府監(jiān)督、教育、犯罪學(xué)、環(huán)保和勘探等領(lǐng)域。
引言
本文是一組系列博客的第四篇文章。這組文章探討的是政府在實施大數(shù)據(jù)策略時所面臨的若干問題。第一篇文章解釋了數(shù)據(jù)的 大 為什么應(yīng)該按照復(fù)雜性而不僅僅是體量來定義。第二篇和第三篇文章講述了大數(shù)據(jù)策略為公共機構(gòu)擺出的四個挑戰(zhàn)。
以下是美國聯(lián)邦機構(gòu)和非聯(lián)邦機構(gòu)積極制定和運用大數(shù)據(jù)策略的幾個例子。希望這些例子能啟發(fā)大家利用自己手中的新一代分析工具探索各種可能性。
例1:大數(shù)據(jù)技術(shù)如何助力欺詐檢測和金融市場分析
美國社會保障局(SSA)利用大數(shù)據(jù)策略來分析大量的非結(jié)構(gòu)化傷殘索賠數(shù)據(jù)。SSA現(xiàn)在能夠更快、更高效地處理醫(yī)學(xué)分類和預(yù)期診斷,重塑整個決策過程,更好地識別可疑的不實索賠。
美國聯(lián)邦住房管理局(FHA)在利用大數(shù)據(jù)分析來管理正向現(xiàn)金流基金方面擁有23年的經(jīng)驗。在房地產(chǎn)泡沫破裂期間,F(xiàn)HA是唯一一家不需要救助的次貸保險機構(gòu)。他們運用大數(shù)據(jù)分析來幫助預(yù)測違約率、償還率和索賠率。另外,他們還利用大數(shù)據(jù)技術(shù)為可能出現(xiàn)的場景構(gòu)建現(xiàn)金流模型,以確定維持正向現(xiàn)金流所需的保費。
美國證券交易委員會(SEC)運用大數(shù)據(jù)策略來監(jiān)督金融市場活動。他們利用自然語言處理程序和網(wǎng)絡(luò)分析來幫助識別違規(guī)交易活動。
例2:大數(shù)據(jù)技術(shù)如何助力健康相關(guān)研究
美國食品藥物管理局(FDA)在全國各地的很多測試相關(guān)實驗室里都部署了大數(shù)據(jù)技術(shù),以便研究食源性疾病的模式。這套數(shù)據(jù)庫屬于該機構(gòu)的技術(shù)轉(zhuǎn)讓項目,能讓FDA更快地對進入食品供應(yīng)的受污染產(chǎn)品作出反應(yīng),這類產(chǎn)品在美國導(dǎo)致每年有32.5萬人因食源性疾病住院治療,3,000人死亡。
美國國立衛(wèi)生研究院(NIH)在2012年啟動了 從大數(shù)據(jù)到知識 (BD2K)計劃。BD2K是一項不僅限于該院的計劃,旨在使生物醫(yī)學(xué)研究成為一項數(shù)字研究事業(yè),促進新知識的發(fā)現(xiàn)和運用,最大程度地提升社會參與度。從生物醫(yī)學(xué)大數(shù)據(jù)中獲取豐富信息的能力,將增進我們對人類健康和疾病的了解。然而,適當(dāng)工具的匱乏、糟糕的數(shù)據(jù)可達性和培訓(xùn)的不足妨礙了我們有效地整合研究力量。BD2K將幫助NIH應(yīng)對這個挑戰(zhàn)。
美國醫(yī)學(xué)研究所(IOM)和衛(wèi)生及公共服務(wù)部(HHS)在2010年3月召集了一小群來自白宮、聯(lián)邦機構(gòu)、學(xué)術(shù)界、社會部門、公共衛(wèi)生團體、信息技術(shù)公司、大企業(yè)和醫(yī)療服務(wù)系統(tǒng)的領(lǐng)導(dǎo)者,商討新的社區(qū)健康數(shù)據(jù)計劃的建立事宜。2010年6月,IOM和HHS舉辦了 社區(qū)健康數(shù)據(jù)論壇:利用信息的力量來改善健康 。此次公共論壇的目的是進一步推動創(chuàng)新者對社區(qū)健康數(shù)據(jù)的使用,讓個人和社區(qū)都能為自身的健康做出明智的選擇。這些初始會議現(xiàn)在已經(jīng)發(fā)展成為正式的全國性大會Health Datapalooza,致力于開放健康數(shù)據(jù),將企業(yè)、初創(chuàng)公司、學(xué)者、政府機構(gòu)和個人聯(lián)合起來,通過對健康數(shù)據(jù)的開創(chuàng)性和有效利用,改善患者的健康狀況。
例3:大數(shù)據(jù)技術(shù)如何助力政府監(jiān)督和教育
通告和評論項目(Notice and Comment project)使公眾可以方便快捷地查看400多萬份政府文件,包括《聯(lián)邦公報》(Federal Register)發(fā)表的聯(lián)邦法規(guī)和地方政府發(fā)布的通告。該項目利用先進分析和自然語言處理來攝取政府文件,追蹤政策、法律和規(guī)章的變化。用戶可以輕而易舉地對擬訂中的聯(lián)邦法規(guī)進行評論或投票。網(wǎng)站數(shù)據(jù)每天都會更新,實時顯示新的提案和趨勢。在提案變成法律之前,用戶可以利用網(wǎng)站內(nèi)部集成的社交媒體和網(wǎng)上的最佳寫作技巧來有效地宣揚他們的觀點,尋求其他人的支持。
美國教育部利用大數(shù)據(jù)挖掘和學(xué)習(xí)分析來改善教學(xué)。美國教育部教育技術(shù)辦公室表示: 大數(shù)據(jù)分析能夠發(fā)現(xiàn)學(xué)習(xí)在線課程的學(xué)生是否走入誤區(qū),并幫助他們調(diào)整方向。這些先進分析還有可能根據(jù)按鍵點擊模式判斷學(xué)生是否對當(dāng)前課程感到無聊,然后重新獲取他們的注意力。由于這些數(shù)據(jù)是實時收集的,因此很有希望通過多個反饋回路實現(xiàn)持續(xù)改善。這些反饋回路的時間跨度不一 對學(xué)生來說是立刻思考下一個問題,對老師來說是每天安排第二天的教學(xué),對校長來說是每月評估進展,對地方官員來說是每年評估總體的學(xué)校教育改善情況。