如今,市場(chǎng)對(duì)數(shù)據(jù)科學(xué)家的需求是巨大的。但是也有不利之處,因?yàn)橛衅姷臄?shù)據(jù),其所面臨的風(fēng)險(xiǎn)也是巨大的。數(shù)據(jù)科學(xué)家凱西 奧尼爾為此創(chuàng)建了數(shù)據(jù)科學(xué)家的一個(gè)倫理政策。
人們可能不知道,數(shù)據(jù)科學(xué)有一個(gè)潛在的黑暗面,這是許多企業(yè)所忽視的東西。在當(dāng)今社會(huì),龐大的數(shù)據(jù)量對(duì)數(shù)據(jù)科學(xué)家造成巨大需求的時(shí)候,數(shù)據(jù)科學(xué)家凱西 奧尼爾不久撰寫一本著作,名為 數(shù)字破壞武器:大數(shù)據(jù)如何增加不平等和威脅民主 。她擔(dān)心的是,在急于利用大數(shù)據(jù)的情況下,可能會(huì)因?yàn)閮?nèi)置偏差使得結(jié)論不準(zhǔn)確,并且可能具有相當(dāng)?shù)钠茐男?。她與高級(jí)技術(shù)編輯瓦勒瑞 斯威特一起探討數(shù)據(jù)科學(xué)領(lǐng)域的偏見,以及為什么企業(yè)需要制定數(shù)據(jù)科學(xué)倫理政策。
奧尼爾:人們認(rèn)為可以解決任何數(shù)據(jù)問題,對(duì)此我感到惱火。我對(duì)這些數(shù)據(jù)持懷疑態(tài)度。
斯威特:那么,那些對(duì)數(shù)據(jù)科學(xué)領(lǐng)域具有偏見的企業(yè)需要害怕什么呢?
凱蒂 奧尼爾:我們有一個(gè)信任問題,而如今卻沒有足夠的審查。每個(gè)組織都需要數(shù)據(jù)科學(xué)家。但是,我們需要讓數(shù)據(jù)科學(xué)家在這些團(tuán)隊(duì)中增加更多類型的人,以確保選擇是經(jīng)過深思熟慮的。數(shù)據(jù)科學(xué)家沒有接受過道德倫理思考或思考這些問題的培訓(xùn)。社會(huì)學(xué)家可能會(huì)看到非預(yù)期的后果,但數(shù)據(jù)科學(xué)家可能會(huì)導(dǎo)致愚蠢的事情發(fā)生。人們的正義和預(yù)警數(shù)據(jù)是基于吉姆克魯法律的,如果組織使用這些歷史數(shù)據(jù)來訓(xùn)練當(dāng)前的模型,他們將是種族主義。假設(shè)是,一旦你對(duì)數(shù)據(jù)做了一些事情,它就會(huì)自動(dòng)使得價(jià)值和目標(biāo)消失。社會(huì)科學(xué)家比數(shù)據(jù)科學(xué)家更為了解其不當(dāng)之處。
斯威特:如果我們不注意數(shù)據(jù)科學(xué)領(lǐng)域的偏見,有什么風(fēng)險(xiǎn)?
奧尼爾:在這個(gè)過程中有一個(gè)風(fēng)險(xiǎn),我們實(shí)際上得到的是自動(dòng)化的偏見。如果團(tuán)隊(duì)中沒有人提出正確的問題,你可以得到偏向于婦女或顏色或老年人的算法。在不久的將來,建立評(píng)估員工的內(nèi)部算法的企業(yè)可能很快將面臨歧視性流程的訴訟。這不是癡人說夢(mèng)。人們需要監(jiān)控這些事情,并確保做得更好,并確保他們不是歧視性的。
斯威特:這只是一個(gè)內(nèi)部問題嗎?
奧尼爾:當(dāng)涉及到招聘等事情時(shí),這是更明顯的,但你可以創(chuàng)建面向客戶的算法。如果你的業(yè)務(wù)與貸款有關(guān),歧視可能就是一個(gè)很明顯的因素。這都有很多例子。
斯威特:那么,人們?nèi)绾螒?yīng)對(duì)數(shù)據(jù)科學(xué)領(lǐng)域的偏見?
奧尼爾:一些大學(xué)開始向數(shù)據(jù)科學(xué)家講授倫理課程。但在這方面沒有很多監(jiān)管。生物醫(yī)學(xué)實(shí)驗(yàn)有很多規(guī)則和倫理,研究人員必須征得同意。這種事情不存在于大數(shù)據(jù)的世界。我們都不斷地進(jìn)行A/B測(cè)試,大多數(shù)時(shí)候是愚蠢的事情,如 這個(gè)廣告圖片是什么顏色的?我們不必同意這些事情。這不是真正的測(cè)試,這個(gè)事情讓人困擾。人們實(shí)際上卻認(rèn)為這些算法是完美的。沒有理由認(rèn)為他們工作會(huì)犯錯(cuò)。就像一家汽車廠商沒有測(cè)量結(jié)果,沒有經(jīng)過安全測(cè)試,就將車輛直接上路行駛一樣。因此人們必須測(cè)量和驗(yàn)證。
編輯:Harris