如果你是商界英才(而不是數(shù)據(jù)科學(xué)家或者機(jī)器學(xué)習(xí)專家),你也許對主流媒體宣傳的人工智能(artificial intelligence,AI)已經(jīng)耳熟能詳了。你在《經(jīng)濟(jì)學(xué)人》和《名利場》雜志上讀過相關(guān)文章,你看到過特斯拉自動駕駛的煽情文章,聽到過史蒂芬?霍金講述人工智能威脅人類的聳人聽聞,甚至迪爾伯特關(guān)于人工智能和人類智能的玩笑你都知道。
此時(shí),胸懷大志要把自己的生意做大做強(qiáng)的你,面對媒體關(guān)于人工智能的碎碎念,可能萌生了兩個(gè)疑問——
第一,人工智能的商業(yè)潛力是真是假?
第二,這玩意怎么用到我的生意上?
對第一個(gè)問題,答案是:千真萬確。今天的商業(yè)活動,可以開始應(yīng)用人工智能來將要求人類智能的活動替換為自動處理以降低成本。人工智能可以允許你將一個(gè)需要人海戰(zhàn)術(shù)的工作通量增加100倍而成本減少90%。
第二個(gè)問題的答案要長一些。首先得消除主流媒體鼓吹導(dǎo)致的誤解。一旦誤解消除,我們才能為你介紹如何應(yīng)用人工智能到自己的生意中去。
誤解一:人工智能是魔術(shù)
多數(shù)主流媒體將人工智能描述為神奇而神秘的。我們只需為大魔術(shù)師般的公司,如Google,F(xiàn)acebook,Apple,Amazon和Microsoft等鼓掌歡呼即可。這樣的描述只是在幫倒忙。如果我們想要人工智能應(yīng)用到商業(yè)活動中,至少需要讓公司的執(zhí)行官們理解它。人工智能不是魔術(shù)。人工智能是數(shù)據(jù)、數(shù)學(xué)、模式和迭代。如果我們想要人工智能應(yīng)用到商業(yè)活動中,我們必須更加透明,并解釋清楚人工智能的3個(gè)互相連鎖的關(guān)鍵概念。
1.訓(xùn)練數(shù)據(jù)(TrainingData,TD)——
訓(xùn)練數(shù)據(jù)是機(jī)器可以用來學(xué)習(xí)的起始數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)有輸入值和自帶答案的輸出值,這樣機(jī)器學(xué)習(xí)模型可以從答案中尋找模式。比如,輸入可以是客服單,帶有客戶和公司的客服代表之間的電子郵件。輸出可以是基于公司某個(gè)分類定義的從1到5的分類標(biāo)簽。
2.機(jī)器學(xué)習(xí)(MachineLearning,ML)——
機(jī)器學(xué)習(xí)是軟件從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到某種模式,并把它應(yīng)用到新的輸入數(shù)據(jù)中。比如,一個(gè)新的客服單,帶有某位客戶和某位公司客服代表的郵件來了,機(jī)器學(xué)習(xí)模型可以預(yù)測出一個(gè)分類,告訴你它對該分類的把握有多大。機(jī)器學(xué)習(xí)的關(guān)鍵特征是,它不是通過固定的規(guī)則來學(xué)習(xí)。因此,當(dāng)它消化新的數(shù)據(jù)后,它會調(diào)整其規(guī)則。
3.人機(jī)回圈(Human-in-the-Loop,HITL)——
人機(jī)回圈是人工智能的第三個(gè)核心成分。我們不能指望機(jī)器學(xué)習(xí)萬無一失。一個(gè)好的機(jī)器學(xué)習(xí)模型大概只有70%的準(zhǔn)確性。因此你需要一個(gè)人機(jī)回圈流程,當(dāng)模型的可信度低時(shí),還可以依靠人。
因此,別被人工智能的神話愚弄了。現(xiàn)在,有了人工智能的公式,在此基礎(chǔ)上,你可以對人工智能有一個(gè)基本的理解了。AI = TD + ML + HITL
誤解2:人工智能是給科技精英用的
媒體報(bào)道似乎暗示,人工智能只是科技精英的菜——只有像Amazon,Apple,F(xiàn)acebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber這些公司能斥上億美金巨資組建龐大的機(jī)器學(xué)習(xí)專家團(tuán)隊(duì)。這個(gè)概念是錯的。
今天,十萬美元即可在商業(yè)過程中開始應(yīng)用人工智能。因此,如果你的公司是全美營業(yè)額在5千萬美元以上的26,000家公司之一,你就可以投入營業(yè)額的0.2%,來啟動人工智能。
因此,人工智能不只屬于高科技公司。它屬于任何行業(yè)。
誤解3:人工智能只解決億萬美元級的大問題
主流媒體敘說的故事,通常是未來式的例子,比如無人駕駛汽車,無人機(jī)投遞包裹。Google,Tesla和Uber這些公司投入了數(shù)億美元爭奪無人駕駛汽車領(lǐng)域的領(lǐng)先地位,因?yàn)椤摆A者通吃”的想法在作怪。這樣的故事給人工智能打上了“花費(fèi)億萬美元開拓創(chuàng)新領(lǐng)域”的烙印。但事實(shí)并非如此。
人工智能也可以用幾百萬美元來解決現(xiàn)有問題。讓我解釋一下。任何生意的一個(gè)核心任務(wù)都是了解客戶。這在最早的市場——古希臘的阿格拉如此,在古羅馬的競技場里面對面做買賣時(shí)如此,在網(wǎng)購盛行的今天也如此。許多公司坐擁非結(jié)構(gòu)化的客戶數(shù)據(jù)寶庫,有電子郵件,也有Twitter評論。人工智能可以用于解決客服單分類或者理解推文情感這樣的難題。
因此人工智能不止是為了解決如無人駕駛汽車這樣的億萬美元級“讓人興奮”的新問題,它也可以解決百萬美元級的現(xiàn)有“無聊”問題,如通過客服單分類或者社交媒體情感分析來了解你的客戶。
誤解4:算法比數(shù)據(jù)更重要
主流媒體對人工智能的報(bào)道偏重于關(guān)注機(jī)器學(xué)習(xí)算法,將其視為最重要的部分。主流媒體似乎把算法與人腦等同了。他們隱約傳達(dá)著這樣一個(gè)信息:復(fù)雜的算法最終會超越人類的大腦并創(chuàng)造奇跡。媒體拿機(jī)器在國際象棋和圍棋比賽里擊敗人類的故事作為例子。而且他們主要關(guān)注“深度神經(jīng)網(wǎng)絡(luò)”和“深度學(xué)習(xí)”,以及機(jī)器是如何做出決策。
這種報(bào)道給人的印象是,一個(gè)公司要想應(yīng)用人工智能就需要聘請機(jī)器學(xué)習(xí)專家來建立完美的算法。但如果一個(gè)企業(yè)沒有思考如何獲得高質(zhì)量的算法,即使機(jī)器學(xué)習(xí)模型經(jīng)過大量的特定訓(xùn)練數(shù)據(jù)學(xué)習(xí)之后,仍然會產(chǎn)生一個(gè)與期望(“我們有一個(gè)偉大的算法”)不匹配的結(jié)果(“我們的模型的準(zhǔn)確率只有60%”)。
現(xiàn)如今,沒有計(jì)劃或訓(xùn)練數(shù)據(jù)的預(yù)算就從微軟,亞馬遜和谷歌購買商業(yè)機(jī)器學(xué)習(xí)的服務(wù),就像買一輛無法接近加油站的車,只是買了一塊昂貴的金屬。汽車和汽油的類比有些不貼切,因?yàn)槿绻憬o機(jī)器學(xué)習(xí)模型的訓(xùn)練數(shù)據(jù)越多,機(jī)器學(xué)習(xí)模型就會越準(zhǔn)確。這就像不斷給汽車加油,汽車的燃料利用率會不斷提高。訓(xùn)練數(shù)據(jù)對于機(jī)器學(xué)習(xí)模型的重要性比汽油對汽車的重要性更高。如果想深入了解對這類誤解性的報(bào)道的話,你可以閱讀我們以前的帖子《更多的數(shù)據(jù)擊敗更好的算法》。
所以關(guān)鍵就是訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量至少是和算法一樣重要的,要確保你部署人工智能的計(jì)劃和預(yù)算反映這一點(diǎn)。
誤解5:機(jī)器>人類
在過去的30年里,無論是施瓦辛格在《終結(jié)者》里扮演的電子人殺手,還是艾麗西亞·維坎德在《機(jī)械姬》里扮演的智能機(jī)器人伊娃,媒體一直喜歡把人工智能描繪成比人類更強(qiáng)大的機(jī)器。媒體想編寫一個(gè)機(jī)器對戰(zhàn)人類誰會成為贏家的故事,這是可以理解的。但卻歪曲了事實(shí)。
例如,最近谷歌DeepMind 的 alphago戰(zhàn)勝韓國棋手李世石的報(bào)道被簡單地描述成機(jī)器戰(zhàn)勝人類。這樣的表達(dá)不是對真實(shí)情況的準(zhǔn)確描述。更準(zhǔn)確的描述是機(jī)器加上一群人打敗了一個(gè)人。
消除這種誤解的主要理由是機(jī)器和人的技能是互補(bǔ)的。從上面的圖中我們可以看出機(jī)器在處理結(jié)構(gòu)化計(jì)算方面有優(yōu)勢。機(jī)器擅長“找到特征向量”的任務(wù),不太擅長“找到豹紋裙”任務(wù)。人類在識別意義和背景上具有得天獨(dú)厚的優(yōu)勢。人類很容易“找到豹紋裙”,但在“找到特征向量”方面跟機(jī)器相比不具有優(yōu)勢。
因此,正確的框架是要意識到在商業(yè)情景下機(jī)器和人是互補(bǔ)的。人工智能是人和機(jī)器共同工作。
錯誤6:人工智能是機(jī)器取代人類
主流媒體為了關(guān)注度喜歡描繪一個(gè)反烏托邦式的未來,這種情況可能會發(fā)生,但這種描述對正確理解人和機(jī)器如何共同工作產(chǎn)生了不利的影響。
例如,讓我們再思索下分類支持票據(jù)的業(yè)務(wù)流程?,F(xiàn)如今大多數(shù)企業(yè)都還是百分百人工操作的。結(jié)果就是不僅進(jìn)度緩慢而且成本線性增長,限制了工作量。現(xiàn)在想象一下用模型分類10,000張支持票的準(zhǔn)確度是70%。30%的錯誤是不能接受的,就需要人機(jī)回圈的參與。你可以設(shè)置可接受的置信閾值為95%并且只接受模型在置信水平不低于95%時(shí)的輸出。所以最初的機(jī)器學(xué)習(xí)模型可能只做了一小部分的工作,比如說5-10%。
? ? ? ?但是,隨著新的人為標(biāo)記的數(shù)據(jù)被創(chuàng)建,并且將其反饋到機(jī)器學(xué)習(xí)模型中,模型會不斷學(xué)習(xí)并提高。隨著時(shí)間的推移,該模型可以處理越來越多的客戶支持票據(jù)分類工作,分類票據(jù)的業(yè)務(wù)量可以顯著提高。
因此,人和機(jī)器共同協(xié)作可以增加業(yè)務(wù)量,保持質(zhì)量,減少重要的業(yè)務(wù)流程的單位成本。
這就消除了人工智能是機(jī)器代替人類的誤解。事實(shí)是,人工智能是關(guān)于機(jī)器增強(qiáng)人類的能力。
錯誤7:人工智能=機(jī)器學(xué)習(xí)
主流媒體帶給人們的最后一條根深蒂固的誤解就是人工智能和機(jī)器學(xué)習(xí)是等同的。這個(gè)誤解就導(dǎo)致了不切實(shí)際的管理期望—從微軟,亞馬遜或谷歌公司購買商業(yè)機(jī)器學(xué)習(xí)的服務(wù)就能神奇地將人工智能運(yùn)用到生產(chǎn)中。
而除了機(jī)器學(xué)習(xí)之外還需要訓(xùn)練數(shù)據(jù)和人機(jī)回圈才有可能找到可行的人工智能解決方案。
沒有訓(xùn)練數(shù)據(jù)的機(jī)器學(xué)習(xí)就像一輛沒有汽油的汽車。既昂貴又無用。
沒有人機(jī)回圈的機(jī)器學(xué)習(xí)是不會有好的產(chǎn)出的。機(jī)器學(xué)習(xí)模型需要人的參與來去除低的置信度預(yù)測。
因此,如果你是一個(gè)想把人工智能應(yīng)用到業(yè)務(wù)上的執(zhí)行官,現(xiàn)在你應(yīng)該對它有一個(gè)認(rèn)識框架了。你應(yīng)該用人工智能的7個(gè)真理來代替這7個(gè)誤解。
真相1:人工智能=訓(xùn)練數(shù)據(jù)+機(jī)器學(xué)習(xí)+人機(jī)回圈
真相2:人工智能屬于任何行業(yè)
真相3:人工智能可以用幾百萬美元來解決現(xiàn)有的商業(yè)問題
真相4:算法并沒有比訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量更重要
真相5:機(jī)器和人是互補(bǔ)的
真相6:人工智能是機(jī)器增強(qiáng)人的能力
真相7:人工智能=訓(xùn)練數(shù)據(jù)+機(jī)器學(xué)習(xí)+人機(jī)回圈