????從技術(shù)上來(lái)看,深度學(xué)習(xí)就是“很多層”的神經(jīng)網(wǎng)絡(luò)。而神經(jīng)網(wǎng)絡(luò)實(shí)質(zhì)上是多層函數(shù)嵌套形成的數(shù)學(xué)模型。事實(shí)上,在深度學(xué)習(xí)出現(xiàn)之前,人工智能已經(jīng)經(jīng)歷了兩次熱潮。
魯迅的文章和人工智能會(huì)有聯(lián)系嗎?在中國(guó)科學(xué)院院士、清華大學(xué)教授張鈸看來(lái),答案是肯定的。
在魯迅的一篇文章中,當(dāng)孩子滿月的時(shí)候,凡是說(shuō)孩子將來(lái)會(huì)發(fā)財(cái)、做官的,都得到了主人的感謝或恭維,而唯一說(shuō)出事實(shí)——“孩子將來(lái)是要死的”的人遭到了一頓合力的痛打。
張鈸開玩笑說(shuō),在當(dāng)下人工智能大躍進(jìn)的局面下,既要說(shuō)實(shí)話,又不想挨一頓合力的痛打,是需要勇氣的。盡管如此,“我還是既要把人工智能的優(yōu)點(diǎn)和成果說(shuō)夠,也要把它存在的問(wèn)題說(shuō)透?!?/p>
在10月20~22日于山西太原舉行的2016中國(guó)計(jì)算機(jī)大會(huì)(CNCC2016)上,和張鈸有同樣勇氣的還有其他一些人工智能領(lǐng)域的“大咖”。他們將問(wèn)題的核心,都指向了人工智能在后深度學(xué)習(xí)時(shí)代的走向。
“彎道超車”還是又一個(gè)日本“五代機(jī)”
作為我國(guó)計(jì)算機(jī)領(lǐng)域目前規(guī)模最大、級(jí)別最高的學(xué)術(shù)會(huì)議,創(chuàng)建于2003年、由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦的中國(guó)計(jì)算機(jī)大會(huì)一向是業(yè)內(nèi)人士暢所欲言的舞臺(tái)。雖然今年CNCC2016的主題是“計(jì)算改變未來(lái)”,但人工智能卻成了事實(shí)上的焦點(diǎn)。
“今年不管開什么會(huì)、誰(shuí)組織、在哪里開,只要和人工智能掛上邊,都很火爆?!敝袊?guó)科學(xué)院副院長(zhǎng)、中國(guó)科學(xué)院院士譚鐵牛對(duì)人工智能當(dāng)下的熱度深有感觸。不過(guò),作為人工智能專家,他深刻地意識(shí)到,“與其說(shuō)人工智能火,不如說(shuō)是深度學(xué)習(xí)火?!?/p>
從技術(shù)上來(lái)看,深度學(xué)習(xí)就是“很多層”的神經(jīng)網(wǎng)絡(luò)。而神經(jīng)網(wǎng)絡(luò)實(shí)質(zhì)上是多層函數(shù)嵌套形成的數(shù)學(xué)模型。事實(shí)上,在深度學(xué)習(xí)出現(xiàn)之前,人工智能已經(jīng)經(jīng)歷了兩次熱潮。在此期間,日本于1981年提出第五代計(jì)算機(jī)研究計(jì)劃,并為此投資了540億日元。當(dāng)時(shí),人工智能研究的先驅(qū)者之一愛德華·費(fèi)根鮑姆認(rèn)為,這項(xiàng)計(jì)劃即使部分實(shí)現(xiàn),也將產(chǎn)生巨大經(jīng)濟(jì)利益,使日本占有市場(chǎng),并奪得統(tǒng)治地位。美國(guó)如不自強(qiáng),事態(tài)將極為嚴(yán)重,在超工業(yè)化社會(huì)中只能處于農(nóng)業(yè)大國(guó)的地位。然而,最終這一計(jì)劃還是以失敗告終。這也意味著人工智能的流派之一符號(hào)主義方法進(jìn)入了瓶頸期。
而今,隨著深度學(xué)習(xí)的出現(xiàn),人工智能又迎來(lái)了“春天”。這是一個(gè)“彎道超車”的機(jī)會(huì)還是又一個(gè)日本的“五代機(jī)”?張鈸認(rèn)為,“這兩種可能都存在,因?yàn)榭茖W(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新總是通過(guò)默默無(wú)聞的勞作和堅(jiān)持不懈的努力取得的,只有這樣才有可能成功。”
在張鈸看來(lái),與30年前相比,現(xiàn)在的人工智能有兩點(diǎn)不同,一是大數(shù)據(jù),二是概率統(tǒng)計(jì)方法的引入。正是這兩個(gè)因素催生了當(dāng)下的深度學(xué)習(xí)大潮。
然而,深度學(xué)習(xí)所解決的問(wèn)題卻有一定的范圍限制,即在一定的應(yīng)用場(chǎng)景里,在給定的數(shù)據(jù)庫(kù)下,有了可利用的大數(shù)據(jù),計(jì)算機(jī)的感知信息處理程度才有可能達(dá)到人類的水平。正因?yàn)樗木窒扌?,“從狹義的人工智能走向通用人工智能,就成為后深度學(xué)習(xí)時(shí)代所要致力的問(wèn)題?!睆堚撜f(shuō)。
不會(huì)“一統(tǒng)江湖、千秋萬(wàn)載”
“從本質(zhì)上說(shuō),(人工智能)第二次和第三次浪潮在方法論上并沒(méi)有本質(zhì)區(qū)別,都屬于連接主義。差別在于深度學(xué)習(xí)的成功。這里既有硬件的進(jìn)步,也有卷積神經(jīng)網(wǎng)絡(luò)模型與參數(shù)訓(xùn)練技巧的進(jìn)步。”中國(guó)工程院院士、北京大學(xué)教授高文認(rèn)為。但他同時(shí)表示,連接主義(神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí))雖然大行其道,但如何解決小數(shù)據(jù)學(xué)習(xí)和創(chuàng)造性思維仍然挑戰(zhàn)巨大。
在南京大學(xué)教授、美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)杰出科學(xué)家周志華看來(lái),發(fā)展至今天,作為人工智能領(lǐng)域一個(gè)重要的分支,“機(jī)器學(xué)習(xí)”已經(jīng)成為一個(gè)廣袤的學(xué)科領(lǐng)域,而“深度學(xué)習(xí)”僅是機(jī)器學(xué)習(xí)中的一個(gè)小分支。
在機(jī)器學(xué)習(xí)出現(xiàn)之前,人工智能的研究者們意識(shí)到,要想提升人工智能水平,僅有邏輯推理能力是不夠的,而要總結(jié)出知識(shí)再“教”給系統(tǒng),也同樣困難。到了20世紀(jì)90年代中后期,人類發(fā)現(xiàn)自己淹沒(méi)在了數(shù)據(jù)的汪洋中,機(jī)器學(xué)習(xí)正是為了滿足人們對(duì)自動(dòng)數(shù)據(jù)分析技術(shù)的需求應(yīng)運(yùn)而生的。而云計(jì)算、大數(shù)據(jù)時(shí)代的到來(lái),計(jì)算能力的大幅提升,使得深度學(xué)習(xí)模型在計(jì)算機(jī)視覺、自然語(yǔ)言處理、語(yǔ)音識(shí)別等眾多領(lǐng)域都取得了較大的成功。
但是,深度學(xué)習(xí)是否會(huì)“一統(tǒng)江湖、千秋萬(wàn)載”呢?周志華認(rèn)為,深度學(xué)習(xí)最重要的作用是“表示學(xué)習(xí)”,即能自動(dòng)學(xué)習(xí)和表達(dá)特征。當(dāng)數(shù)據(jù)的“初始表示”(如圖像的“像素”)與解決任務(wù)所需的“合適表示”(如描述物體的特征)相距甚遠(yuǎn)的時(shí)候,就是深度學(xué)習(xí)應(yīng)用的領(lǐng)域。然而,很多學(xué)習(xí)任務(wù),數(shù)據(jù)的“初始表示”與“合適表示”并沒(méi)有那么遠(yuǎn),因此深度學(xué)習(xí)不會(huì)“一統(tǒng)江湖”,其他一些機(jī)器學(xué)習(xí)技術(shù)也有自己的“用武之地”。未來(lái)深度學(xué)習(xí)可能有“冬天”,因?yàn)樗鼉H是機(jī)器學(xué)習(xí)中的一種技術(shù),更“潮”的技術(shù)總會(huì)出現(xiàn)。而機(jī)器學(xué)習(xí)不會(huì)有“冬天”,除非我們不再需要分析數(shù)據(jù)。
高文最近和美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)接觸發(fā)現(xiàn),美國(guó)現(xiàn)在對(duì)于深度學(xué)習(xí)有很大的爭(zhēng)議。雖然在機(jī)器學(xué)習(xí)領(lǐng)域,NSF仍然支持深度學(xué)習(xí)的基礎(chǔ)理論研究,但認(rèn)為在應(yīng)用領(lǐng)域(如計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、計(jì)算語(yǔ)言學(xué)等)使用深度學(xué)習(xí)解決實(shí)際問(wèn)題已經(jīng)不算創(chuàng)新,此類項(xiàng)目基本上都會(huì)被“殺掉”?!斑@給了我們一個(gè)信號(hào),也許幾年之后深度學(xué)習(xí)真的會(huì)進(jìn)入沉寂期?!?/p>
未來(lái)走向
張鈸認(rèn)為,在后深度學(xué)習(xí)時(shí)代,人工智能主要面臨三大挑戰(zhàn),一是概率統(tǒng)計(jì)方法帶來(lái)的困難,即它只能找出重復(fù)出現(xiàn)的特征,發(fā)現(xiàn)數(shù)據(jù)間統(tǒng)計(jì)的關(guān)聯(lián)性,卻不能發(fā)現(xiàn)本質(zhì)特征,找到因果關(guān)系。其次是生數(shù)據(jù)帶來(lái)的困難,實(shí)際上,網(wǎng)絡(luò)數(shù)據(jù)中只有34%是有用的,66%則是虛假、無(wú)用的,這會(huì)嚴(yán)重影響識(shí)別的效果。三是不能舉一反三,進(jìn)行領(lǐng)域遷移。而要想實(shí)現(xiàn)突破,人工智能發(fā)展除了需要知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)結(jié)合從而“雙輪驅(qū)動(dòng)”外,更加要依靠學(xué)科交叉,特別是數(shù)學(xué)、認(rèn)知科學(xué)、心理學(xué)、神經(jīng)科學(xué)和語(yǔ)言學(xué)等。
從深度學(xué)習(xí)的發(fā)展歷史來(lái)看,深度學(xué)習(xí)是相對(duì)最容易利用新增計(jì)算能力的機(jī)器學(xué)習(xí)方法。因此,周志華預(yù)測(cè),未來(lái)的主流技術(shù)未必是深度學(xué)習(xí),但應(yīng)該是能有效利用GPU等計(jì)算設(shè)備的方法。
此外,隨著人工智能技術(shù)取得巨大發(fā)展,將越來(lái)越多地面臨“高風(fēng)險(xiǎn)應(yīng)用”,因此必須有“魯棒的人工智能”。對(duì)此,周志華的理解是,“好的時(shí)候”要好,“壞的時(shí)候”也不能太壞。而開放環(huán)境下的機(jī)器學(xué)習(xí)研究,是通向“魯棒人工智能”途徑上的關(guān)鍵環(huán)節(jié)之一。
談及機(jī)器學(xué)習(xí)的形態(tài),周志華認(rèn)為,模型和規(guī)約相結(jié)合的學(xué)件的出現(xiàn),將會(huì)改變機(jī)器學(xué)習(xí)目前算法加數(shù)據(jù)的現(xiàn)狀,從而突破機(jī)器學(xué)習(xí)的一些局限,如需要大量訓(xùn)練樣本,難以適應(yīng)環(huán)境變化,模型不透明等。今后,當(dāng)用戶想要應(yīng)用一個(gè)模型的時(shí)候,他可以先到“學(xué)件”市場(chǎng)找一找有無(wú)合適的,或者選擇一個(gè)現(xiàn)成的模型加以修改后使用。而“學(xué)件”的誕生,很可能會(huì)催生出一個(gè)新的類似軟件產(chǎn)業(yè)的新產(chǎn)業(yè)。
?