2.3.2 查準(zhǔn)率、查全率與Fl
錯(cuò)誤率和精度雖常用,但并不能滿(mǎn)足所有任務(wù)需求.以西瓜問(wèn)題為例,假定瓜農(nóng)拉來(lái)一車(chē)西瓜,我們用訓(xùn)練好的模型對(duì)這些西瓜進(jìn)行判別,顯然,錯(cuò)誤率衡量了有多少比例的瓜被判別錯(cuò)誤.但是若我們關(guān)心的是“挑出的西瓜中有多少比例是好瓜”,或者“所有好瓜中有多少比例被挑了出來(lái)”,那么錯(cuò)誤率顯然就不夠用了,這時(shí)需要使用其他的性能度量,類(lèi)似的需求在信息檢索、Web搜索等應(yīng)用中經(jīng)常出現(xiàn),例如在信息檢索中,我們經(jīng)常會(huì)關(guān)心“檢索出的信息中有多少比例是用戶(hù)感興趣的”“用戶(hù)感興趣的信息中有多少被檢索出來(lái)了”,“查準(zhǔn)率”(precision)與“查全查準(zhǔn)率亦稱(chēng)“準(zhǔn)確率”率”(recall)是更為適用于此類(lèi)需求的性能度量,查全率亦稱(chēng)“召回率”.對(duì)于二分類(lèi)問(wèn)題,可將樣例根據(jù)其真實(shí)類(lèi)別與學(xué)習(xí)器預(yù)測(cè)類(lèi)別的組合劃分為真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)四種情形,令TP、FP、TN、FN分別表示其對(duì)應(yīng)的樣例數(shù),則顯然有TP+FP+TN+FN=樣例總數(shù).