伊人99re_av日韩成人_91高潮精品免费porn_色狠狠色婷婷丁香五月_免费看的av_91亚色网站

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 軟件研發(fā) > “自助法”(bootstrapping)是一個比較好的解決方案

“自助法”(bootstrapping)是一個比較好的解決方案

2018-08-16 09:57:41 | 來源:中培企業(yè)IT培訓(xùn)網(wǎng)

2.2.3  自助法
      我們希望評估的是用D訓(xùn)練出的模型,但在留出法和交叉驗(yàn)證法中,由于保留了一部分樣本用于測試,因此實(shí)際評估的模型所使用的訓(xùn)練集比D小,這必然會引入一些因訓(xùn)練樣本規(guī)模不同而導(dǎo)致的估計偏差.留一法受訓(xùn)練樣本規(guī)模變化的影響較小,但計算復(fù)雜度又太高了:有沒有什么辦法可以減少訓(xùn)練樣本規(guī)模不同造成的影響,同時還能比較高效地進(jìn)行實(shí)驗(yàn)估計呢?
  “自助法”(bootstrapping)是一個比較好的解決方案,它直接以自助采樣法(bootstrap sampling)為基礎(chǔ)[Efron and Tibshirani,1993].給定包含m個樣本的數(shù)據(jù)集D,我們對它進(jìn)行采樣產(chǎn)生數(shù)據(jù)集D7:每次隨機(jī)從D中挑選一個樣本,將其拷貝放入D',然后再將該樣本放回初始數(shù)據(jù)集D中,使得該樣本在下次采樣時仍有可能被采到;這個過程重復(fù)執(zhí)行m次后,我們就得到了包含m個樣本的數(shù)據(jù)集D7,這就是自助采樣的結(jié)果.顯然,D中有一部分樣本會在D'中多次出現(xiàn),而另一部分樣本不出現(xiàn).可以做一個簡單的估計,樣本在m次采樣中始終不被采到的概率是(1 -擊)…,取極限得到即通過自助采樣,初始數(shù)據(jù)集D中約有36.8070的樣本未出現(xiàn)在采樣數(shù)據(jù)集D'中,于是我們可將D'用作訓(xùn)練集,DD'用作測試集;這樣,實(shí)際評估的模型與期望評估的模型都使用m個訓(xùn)練樣本,而我們?nèi)杂袛?shù)據(jù)總量約1/3的、沒在訓(xùn)練集中出現(xiàn)的樣本用于測試.這樣的測試結(jié)果,亦稱“包外估計”(out-of-bagestimate).自助法在數(shù)據(jù)集較小、難以有效劃分訓(xùn)練/測試集時很有用;此外,自助法能從初始數(shù)據(jù)集中產(chǎn)生多個不同的訓(xùn)練集,這對集成學(xué)習(xí)等方法有很大的好處,然而,自助法產(chǎn)生的數(shù)據(jù)集改變了初始數(shù)據(jù)集的分布,這會引入估計偏差.因此,在初始數(shù)據(jù)量足夠時,留出法和交叉驗(yàn)證法更常用一些.?

標(biāo)簽: bootstrapping

相關(guān)閱讀

主站蜘蛛池模板: 成人做爰高潮片免费视频九九九 | 日本xx视频免费观看 | 美女免费视频黄 | 麻豆资源网 | 蜜臀人妻精品一区二区免费 | 911网站大全在线观看 | 国产成人精品一区在线播放 | 成人h动漫免费观看网站 | 中出一区二区三区 | 国产精品久久一区二区三区不卡 | 日日噜噜大屁股熟妇 | 91免费高清无砖码网站 | 狠狠爱免播放器 | 亚洲成人涩涩 | 伊人久久大香线蕉AV综合 | 亚洲免费高清 | 香港a毛片免费全部播放 | 国产最新毛片 | 色欲午夜无码久久久久久 | 免费看av网页 | 久久精品无码一区二区日韩av | 欧美精品网址 | 国产avxxx| 亚洲国产精品国自产拍av秋霞 | 日本视频a | 亚洲国产成人久久一区www妖精 | 日本女优免费一区 | 精品一区二区久久久久久久网站 | 国产成人亚洲精品无码影院BT | 污污av| www亚洲一区 | 亚洲中文字幕乱伦 | 九色腾高清 | 91精品国产自产在线老师啪 | 中文在线免费二区三区 | 91社区在线?看?清 | 狠狠色噜噜狠狠狠狠888奇禾 | 99久久人妻精品免费二区 | 色久综合网精品一区二区 | 欧洲黄色毛片 | 无码午夜福利免费区久久 |