機(jī)器學(xué)習(xí)是當(dāng)今的時(shí)髦詞。它的應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。隨著電腦在圍棋等游戲中擊敗了專(zhuān)業(yè)人士,許多人開(kāi)始質(zhì)疑電腦是否也能讓司機(jī)、甚至醫(yī)生變得更好。
許多最先進(jìn)的機(jī)器學(xué)習(xí)模型在功能上都是黑盒,因?yàn)閹缀醪豢赡軐?duì)其內(nèi)部工作原理有任何感覺(jué)。這給我們帶來(lái)了一個(gè)信任的問(wèn)題:我是否相信模型中的某個(gè)預(yù)測(cè)是正確的?或者我是否相信模型總體上做出了合理的預(yù)測(cè)?雖然圍棋的賭注很低,但如果一臺(tái)電腦取代了我的醫(yī)生,或者決定我是否恐怖主義嫌疑人(有興趣的人嗎?)或許更常見(jiàn)的情況是,如果一家公司正在用基于機(jī)器學(xué)習(xí)的系統(tǒng)替換某些系統(tǒng),它必須相信機(jī)器學(xué)習(xí)模型將表現(xiàn)得相當(dāng)好。
從直覺(jué)上看,解釋單個(gè)預(yù)測(cè)背后的基本原理,將使我們更容易信任或不信任預(yù)測(cè),或整個(gè)分類(lèi)器。即使我們不能理解模型在所有情況下的行為,也有可能(實(shí)際上在大多數(shù)情況下)理解它在特定情況下的行為。
最后,我要說(shuō)的是準(zhǔn)確性。如果您有機(jī)器學(xué)習(xí)的經(jīng)驗(yàn),我敢打賭您一定會(huì)這樣想:“我當(dāng)然知道我的模型在現(xiàn)實(shí)世界中會(huì)表現(xiàn)得很好,我的交叉驗(yàn)證準(zhǔn)確度真的很高!”為什么我要去理解它的預(yù)測(cè)呢? 99%的時(shí)候我都知道它是對(duì)的。
任何在現(xiàn)實(shí)世界中(不僅僅是在靜態(tài)數(shù)據(jù)集中)使用過(guò)機(jī)器學(xué)習(xí)的人都可以證明,交叉驗(yàn)證的準(zhǔn)確性可能非常具有誤導(dǎo)性。有時(shí),不應(yīng)該是可用的數(shù)據(jù)會(huì)意外地泄漏到培訓(xùn)數(shù)據(jù)中。
有時(shí)候,您收集數(shù)據(jù)的方式引入了現(xiàn)實(shí)世界中不存在的相關(guān)性,而這正是模型所利用的。許多其他棘手的問(wèn)題可以讓我們錯(cuò)誤地理解性能,甚至在做a /B測(cè)試時(shí)也是如此。我不是說(shuō)您不應(yīng)該測(cè)量準(zhǔn)確性,只是說(shuō)它不應(yīng)該是您評(píng)估信任的唯一標(biāo)準(zhǔn)。
機(jī)器學(xué)習(xí)是門(mén)復(fù)雜的多領(lǐng)域交叉學(xué)科,如果想要深入了解機(jī)器學(xué)習(xí),還需多瀏覽書(shū)籍,以及在實(shí)戰(zhàn)中進(jìn)行學(xué)習(xí)。
想了解更多IT資訊,請(qǐng)?jiān)L問(wèn)中培偉業(yè)官網(wǎng):中培偉業(yè)