在電視或者網(wǎng)絡(luò)上,我們會(huì)看到一些被像素化的文字或者臉部。這是出于隱私考慮,某些信息不適合展示給大眾,或者會(huì)給當(dāng)事人帶來(lái)困擾。不過(guò),隨著科技的進(jìn)步,這種保護(hù)隱私的方法已經(jīng)不那么可靠了。因?yàn)椋巳祟?lèi)以外,人工智能也加入到圖像識(shí)別的行列中。
據(jù)Wired網(wǎng)站的報(bào)道,德州大學(xué)和康奈爾科技學(xué)院的研究人員發(fā)現(xiàn),通過(guò)一些訓(xùn)練,神經(jīng)網(wǎng)絡(luò)可以識(shí)別圖像中隱藏的信息,無(wú)論是模糊的門(mén)牌號(hào),還是像素化的人臉。而且,他們并不需要費(fèi)力開(kāi)發(fā)新的方法,只要使用主流的機(jī)器學(xué)習(xí)方法就行了。
我們使用了非常標(biāo)準(zhǔn)的圖像識(shí)別技術(shù)。這才是讓人不安的地方。 康奈爾科技的研究員Vitaly Shmatikov說(shuō)。由于這些方法廣為人知,解析圖片隱藏信息只需要一些基礎(chǔ)的技術(shù) 。
在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的過(guò)程中,研究人員使用了幾個(gè)大型的圖像庫(kù)。當(dāng)神經(jīng)網(wǎng)絡(luò)看到的單詞、臉部或者物品越多,它的識(shí)別準(zhǔn)確率就會(huì)越高。在神經(jīng)網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率達(dá)到90% 后,研究人員用三種隱私工具處理了圖像,并且讓神經(jīng)網(wǎng)絡(luò)繼續(xù)解析這些圖像。最后,他們開(kāi)始用新的模糊圖像測(cè)試神經(jīng)網(wǎng)絡(luò),看它是否能夠辨識(shí)出面部、物品或者手寫(xiě)的數(shù)字。
結(jié)果是,在某些數(shù)據(jù)庫(kù)和隱私技術(shù)上,神經(jīng)網(wǎng)絡(luò)的成功率達(dá)到80%,甚至是90%。在像素化圖像方面,隨著圖片模糊程度增加,神經(jīng)網(wǎng)絡(luò)的成功率會(huì)降低,但是,它仍然能夠達(dá)到50% 到75% 的成功率。
值得注意的是,神經(jīng)網(wǎng)絡(luò)并不能憑空恢復(fù)圖像,或者把模糊的圖片完全還原。它只能將其與自己見(jiàn)過(guò)的東西聯(lián)系起來(lái)。比如,在火車(chē)站的監(jiān)控圖像里,如果每個(gè)過(guò)往人員的面部都是模糊的,神經(jīng)網(wǎng)絡(luò)不能識(shí)別每個(gè)人,但是,如果你懷疑某人在特定時(shí)間經(jīng)過(guò),那么,神經(jīng)網(wǎng)絡(luò)就能從眾人中辨識(shí)出那個(gè)人。
通過(guò)此項(xiàng)研究,研究人員向隱私人士和安全人員提出了警告。在圖像識(shí)別和數(shù)據(jù)收集上,機(jī)器學(xué)習(xí)已經(jīng)成為不可忽視的工具。 我希望,經(jīng)過(guò)了這項(xiàng)研究,當(dāng)人們發(fā)布隱私技術(shù)并且宣稱(chēng)其安全之前,首先要經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的分析, Shamatikov說(shuō)。