在電視或者網(wǎng)絡(luò)上,我們會(huì)看到一些被像素化的文字或者臉部。這是出于隱私考慮,某些信息不適合展示給大眾,或者會(huì)給當(dāng)事人帶來困擾。不過,隨著科技的進(jìn)步,這種保護(hù)隱私的方法已經(jīng)不那么可靠了。因?yàn)?,除了人類以外,人工智能也加入到圖像識(shí)別的行列中。
據(jù)Wired網(wǎng)站的報(bào)道,德州大學(xué)和康奈爾科技學(xué)院的研究人員發(fā)現(xiàn),通過一些訓(xùn)練,神經(jīng)網(wǎng)絡(luò)可以識(shí)別圖像中隱藏的信息,無論是模糊的門牌號(hào),還是像素化的人臉。而且,他們并不需要費(fèi)力開發(fā)新的方法,只要使用主流的機(jī)器學(xué)習(xí)方法就行了。
我們使用了非常標(biāo)準(zhǔn)的圖像識(shí)別技術(shù)。這才是讓人不安的地方。 康奈爾科技的研究員Vitaly Shmatikov說。由于這些方法廣為人知,解析圖片隱藏信息只需要一些基礎(chǔ)的技術(shù) 。
在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的過程中,研究人員使用了幾個(gè)大型的圖像庫。當(dāng)神經(jīng)網(wǎng)絡(luò)看到的單詞、臉部或者物品越多,它的識(shí)別準(zhǔn)確率就會(huì)越高。在神經(jīng)網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率達(dá)到90% 后,研究人員用三種隱私工具處理了圖像,并且讓神經(jīng)網(wǎng)絡(luò)繼續(xù)解析這些圖像。最后,他們開始用新的模糊圖像測試神經(jīng)網(wǎng)絡(luò),看它是否能夠辨識(shí)出面部、物品或者手寫的數(shù)字。
結(jié)果是,在某些數(shù)據(jù)庫和隱私技術(shù)上,神經(jīng)網(wǎng)絡(luò)的成功率達(dá)到80%,甚至是90%。在像素化圖像方面,隨著圖片模糊程度增加,神經(jīng)網(wǎng)絡(luò)的成功率會(huì)降低,但是,它仍然能夠達(dá)到50% 到75% 的成功率。
值得注意的是,神經(jīng)網(wǎng)絡(luò)并不能憑空恢復(fù)圖像,或者把模糊的圖片完全還原。它只能將其與自己見過的東西聯(lián)系起來。比如,在火車站的監(jiān)控圖像里,如果每個(gè)過往人員的面部都是模糊的,神經(jīng)網(wǎng)絡(luò)不能識(shí)別每個(gè)人,但是,如果你懷疑某人在特定時(shí)間經(jīng)過,那么,神經(jīng)網(wǎng)絡(luò)就能從眾人中辨識(shí)出那個(gè)人。
通過此項(xiàng)研究,研究人員向隱私人士和安全人員提出了警告。在圖像識(shí)別和數(shù)據(jù)收集上,機(jī)器學(xué)習(xí)已經(jīng)成為不可忽視的工具。 我希望,經(jīng)過了這項(xiàng)研究,當(dāng)人們發(fā)布隱私技術(shù)并且宣稱其安全之前,首先要經(jīng)過神經(jīng)網(wǎng)絡(luò)的分析, Shamatikov說。