互聯(lián)網(wǎng)內(nèi)容發(fā)展與圖像識(shí)別技術(shù)
早在2013年,全世界每天會(huì)上傳超過5億張圖片、上傳20萬(wàn)小時(shí)長(zhǎng)的視頻到互聯(lián)網(wǎng)。但是人們每天在Instagram分享近6000萬(wàn)張照片,在Facebook分享近3億張 當(dāng)然,還沒算上Snapchat、Google 、Twitter等大量產(chǎn)圖的應(yīng)用。據(jù)估計(jì),一年后就可達(dá)到18億,所以在三年后的今天,這個(gè)數(shù)值必然遠(yuǎn)超乎我們的想象。確實(shí),人們相比過去,互聯(lián)網(wǎng)的數(shù)據(jù)每年都在爆炸式增長(zhǎng)。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的,等到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
可以看得出,圖片和視頻內(nèi)容已成為用戶表達(dá)、事件記錄分析中不可或缺的部分,在多方面發(fā)揮越來(lái)越重要的價(jià)值。但隨著互聯(lián)網(wǎng)的發(fā)展,內(nèi)容安全成為互聯(lián)網(wǎng)不得不面臨的嚴(yán)峻挑戰(zhàn)。因此,面對(duì)互聯(lián)網(wǎng)的基礎(chǔ)需求 內(nèi)容審核,圖像識(shí)別技術(shù)可以以此為契機(jī),為互聯(lián)網(wǎng)圖像內(nèi)容穩(wěn)定高效的發(fā)展保駕護(hù)航。
圖像識(shí)別技術(shù)與人工智能
說起圖像識(shí)別,我們知道,人的圖像識(shí)別能力是非常強(qiáng)大的。圖像距離的改變或圖像在感覺器官上作用位置的改變,都會(huì)造成圖像在視網(wǎng)膜上的大小和形狀的改變。即使在這種情況下,人們?nèi)匀豢梢哉J(rèn)出他們過去知覺過的圖像。甚至圖像識(shí)別可以不受感覺通道的限制。例如,人眼可以看字,當(dāng)別人在他手上寫字時(shí),他也可以認(rèn)出這個(gè)字。
而計(jì)算機(jī)圖像識(shí)別技術(shù)是計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)。識(shí)別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。
圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。簡(jiǎn)單來(lái)說,圖像識(shí)別就是計(jì)算機(jī)如何像人一樣讀懂圖片的內(nèi)容。而圖像識(shí)別所研究的問題,是如何用計(jì)算機(jī)代替人類去自動(dòng)處理大量的物理信息,解決人類所無(wú)法識(shí)別或者識(shí)別過于耗費(fèi)資源的問題,從而很大程度上解放人類的勞動(dòng)力。
圖像識(shí)別技術(shù)與內(nèi)容審核技術(shù)的融合
因此,對(duì)于互聯(lián)網(wǎng)如此大量的圖像內(nèi)容審核需求,圖像識(shí)別技術(shù)如何實(shí)現(xiàn)其中的融合與發(fā)展,從而解放大量每日做著簡(jiǎn)單重復(fù)的工作的內(nèi)容審核人員是非常值得我們期待。
傳統(tǒng)的圖像審核方式主要有三種:1、純?nèi)斯徍耍浩髽I(yè)員工 三班倒 工作,人眼鑒別該圖片或視頻是否違規(guī);2、建立MD5數(shù)據(jù)庫(kù):DNA是人類唯一的身份識(shí)別碼,而圖片、視頻的DNA無(wú)疑是MD5,網(wǎng)監(jiān)建立了違規(guī)圖片、視頻的MD5數(shù)據(jù)庫(kù),用戶上傳后自動(dòng)分析MD5是否合法,則可避免涉黃內(nèi)容重復(fù)分享。3、傳統(tǒng)的智能審核:如識(shí)別色情圖像,基本是通過圖片 RGB 值識(shí)別膚色比例、通過建模識(shí)別異常動(dòng)作、敏感部位等。
但是三個(gè)審核方式都存在較大的漏洞, 三班倒 的人工容易導(dǎo)致審核效率低、誤判漏判多等主觀性問題;MD5則非常容易被篡改,在視頻中加入文字或者修改任意一幀就能實(shí)現(xiàn);傳統(tǒng)智能識(shí)別色情圖片準(zhǔn)確率低、經(jīng)常誤報(bào)等。而且這三種審核方式對(duì)近兩年熱門的視頻直播審核需求更難以滿足。
但以圖普科技為代表的互聯(lián)網(wǎng)圖像內(nèi)容審核專家,基于人工智能與圖像識(shí)別技術(shù)領(lǐng)域最新的算法:深度學(xué)習(xí)算法,通過模擬人腦神經(jīng)網(wǎng)絡(luò),構(gòu)建具有高層次表現(xiàn)力的模型,能夠?qū)Ω邚?fù)雜度數(shù)據(jù)形成良好的解讀。通過大數(shù)據(jù)持續(xù)訓(xùn)練、頻繁的迭代,圖普科技的圖像識(shí)別云平臺(tái)的內(nèi)容審核產(chǎn)品的精確度達(dá)到99.5%,有效節(jié)省超過90%的人工復(fù)審工作。
目前,圖普科技基于圖像識(shí)別技術(shù)的主要的內(nèi)容審核產(chǎn)品有:
色情識(shí)別
智能識(shí)別圖片和視頻內(nèi)容,并對(duì)色情程度進(jìn)行打分,方便用戶對(duì)涉黃內(nèi)容進(jìn)行快速處理,幫助用戶減少審核人力,有效降低涉黃風(fēng)險(xiǎn)。
暴恐識(shí)別
識(shí)別ISIS、東突等各類國(guó)家命令禁止的暴恐圖片及視頻內(nèi)容。
時(shí)政敏感內(nèi)容識(shí)別
建立敏感數(shù)據(jù)庫(kù),提供定制化的解決方案,如識(shí)別國(guó)家領(lǐng)導(dǎo)人、政治運(yùn)動(dòng)場(chǎng)景等時(shí)政敏感性內(nèi)容。
OCR
主要針對(duì)廣告內(nèi)容過濾,自動(dòng)識(shí)別圖像內(nèi)容是屬于正常、二維碼或者帶文字的廣告等圖片內(nèi)容。
圖普科技通過圖像識(shí)別技術(shù),將圖片與樣本庫(kù)中的海量樣本圖進(jìn)行對(duì)比判斷,根據(jù)判斷返回圖片的狀態(tài),可判斷一張圖片是否為正常、色情、暴恐、廣告或其他的敏感內(nèi)容等。
并且,圖普科技的圖像識(shí)別云平臺(tái)還可以幫助企業(yè)定制自己的圖像識(shí)別引擎,使用機(jī)器來(lái)代替人工對(duì)需要審核圖片和視頻進(jìn)行鑒別。就無(wú)需聘請(qǐng)人工智能識(shí)別的專家組建研發(fā)團(tuán)隊(duì),通過接入API調(diào)用識(shí)別服務(wù)即可。這在極大程度上降低了互聯(lián)網(wǎng)行業(yè)應(yīng)用圖像識(shí)別服務(wù)的門檻,從而為更多互聯(lián)網(wǎng)企業(yè)使用人工智能圖像識(shí)別技術(shù)提供了更大的機(jī)會(huì)。
內(nèi)容審核對(duì)于互聯(lián)網(wǎng)圖像內(nèi)容發(fā)展來(lái)說是一項(xiàng)艱巨而又關(guān)鍵的任務(wù),是后續(xù)的圖像內(nèi)容運(yùn)營(yíng)與發(fā)展的最基礎(chǔ)保障。圖普科技深知將要將圖像識(shí)別技術(shù)更好地融合到內(nèi)容審核領(lǐng)域,實(shí)現(xiàn)更高的準(zhǔn)確率,是非常值得重視的,因此,盡管在業(yè)界已經(jīng)擁有一定的知名度,圖普科技仍然深耕于內(nèi)容審核與圖像識(shí)別技術(shù)領(lǐng)域,把圖像識(shí)別技術(shù)視為內(nèi)容審核及互聯(lián)網(wǎng)圖像內(nèi)容發(fā)展領(lǐng)域的未來(lái),在將圖像識(shí)別技術(shù)更好地應(yīng)用于具體的行業(yè)需求方面,為其他的人工智能應(yīng)用提供了一條有價(jià)值的參考途徑。