1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          詳解stacking過程

          來源:互聯網轉載 時間:2023-12-14 14:37:04

          翻到之前自己寫的這篇博客,感覺寫的還是不夠簡潔明了,特地回來改一下,順便文末附上Kaggle內相關操作的代碼,希望能夠幫助學習的同學能夠瞬間理解stacking這個概念。

          stacking:stacking是一種分層模型集成框架。以兩層為例,第一層由多個基學習器組成,其輸入為原始訓練集,第二層的模型則是以第一層基學習器的輸出作為特征加入訓練集進行再訓練,從而得到完整的stacking模型。stacking的方法在各大數據挖掘比賽上都很風靡,模型融合之后能夠小幅度的提高模型的預測準確度。

          stacking詳解:

          借用拍拍貸風控比賽幾位大神這張模型融合的例子,來講解一下。其中的第三模塊,預測M3數據就是一個stacking的過程。

          • 第一層:我們采用RF、ET、GBDT、XGB四種模型,分別對訓練樣本進行預測,然后將預測結果作為下一層的訓練樣本。

          具體訓練過程:

          1. 劃分training data為K折,為各個模型的訓練打下基礎;
          2. 針對各個模型RF、ET、GBDT、XGB,分別進行K次訓練,每次訓練保留K分之一的樣本用作訓練時的檢驗,訓練完成后對testing data進行預測,一個模型會對應5個預測結果,將這5個結果取平均;
          3. 最后分別得到四個模型運行5次之后的平均值,同時拼接每一系列模型對訓練數據集的預測結果帶入下一層;

          圖解:

          舉例:比如針對第一個模型RF,我們先將數據集劃分成5折,1,2,3,4,5。步驟如下:

          1. 保留2,3,4,5訓練,用1做測試數據(查看當前訓練的效果,可配合early stop)記錄下該折測試數據的預測結果,同時預測testing data(此處的testing data就是我們要最終提交結果的那部分數據);
          2. 保留1,3,4,5訓練,用2做測試數據并記錄下該折測試數據的預測結果,預測testing data;
          3. 保留1,2,4,5訓練,用3做測試數據并記錄下該折測試數據的預測結果,預測testing data;
          4. 保留1,2,3,5訓練,用4做測試數據并記錄下該折測試數據的預測結果,預測testing data;
          5. 保留1,2,3,4訓練,用5做測試數據并記錄下該折測試數據的預測結果,預測testing data;
          6. 訓練五輪之后得到針對testing data的五個預測值,取平均值,同時拼接每一系列模型對訓練數據集的預測結果;

          接下來再用同樣的方法訓練ET、GBDT、XGB,注意保持K折數據的一致!全部訓練完成之后,將得到的四個預測結果帶入下一層預測。

          • 第二層:將上一層的四個結果帶入新的模型,進行訓練再預測。第二層的模型一般為了防止過擬合會采用簡單的模型。

          具體訓練過程:將四個預測結果,拼接上各個樣本的真實label,帶入模型進行訓練,最終再預測得到的結果就是stacking融合之后的最終預測結果了。

          以上即為stacking的完整步驟!

          Blending大體與stacking類似,只是將Kfold CV改為了HoldOut CV,也就是原來Kfold CV是等距劃分訓練集,HoldOut CV根據自己定義的百分比進行訓練集測試集的劃分。

          為方便理解,附上Kaggle stacking代碼:https://www.kaggle.com/arthurtok/introduction-to-ensembling-stacking-in-python

          網絡推廣與網站優化公司(網絡優化與推廣專家)作為數字營銷領域的核心服務提供方,其價值在于通過技術手段與策略規劃幫助企業提升線上曝光度、用戶轉化率及品牌影響力。這...

          在當今數字化時代,公司網站已成為企業展示形象、傳遞信息和開展業務的重要平臺。然而,對于許多公司來說,網站建設的價格是一個關鍵考量因素。本文將圍繞“公司網站建設價...

          在當今的數字化時代,企業網站已成為企業展示形象、吸引客戶和開展業務的重要平臺。然而,對于許多中小企業來說,高昂的網站建設費用可能會成為其發展的瓶頸。幸運的是,隨...

          500元等于多少?答:3360500元可以等于500元。但是,從題目的問題中,我們可以猜測出多種情況。500元可以是、越南、等外幣。隨著世界貿易組織積極推動各國經濟發展,各國貨幣可以進入世界貿易進行兌換,但總體上還是以強國經濟為主。500元等于多少?500元相當于500元。元是,我國的貨幣單位。是的法定貨幣,是全國管理的主管機關,負責的設計、印制和發行。的單位是,的輔幣是分和美分。1元等于10角,...

          奔馳cls系列是什么意思?你好,梅賽德斯-奔馳CLS的代表是轎車、四門轎車和運動型轎車。在2004年第74屆日內瓦車展上,梅賽德斯-奔馳首次發布了代號梅賽德斯-奔馳。這款全新四門轎車完美結合了雙門轎跑的經典比例、吸引人的外觀、豪華車的舒適性和功能性,在上市后得到了廣泛的贊譽。cls是什么意思?CLS是VB中的一個語言函數。(CLS,clear screen)功能:清除屏幕上的所有顯示,將光標放在屏...

          要流暢的看VR電腦配置,越高越好。目前VR主要針對要求高的顯卡(與成像相關)。目前很多VR廠商都為自己的VR軟件推薦了電腦配置,但是官網查??偟膩碚f只有幾個大項:四代以上,I5處理器8G,內存4G,顯卡,光學主機一般價格在5000以上??梢粤鲿呈褂肰R。根據目前VR的硬件形式,VR頭戴設備主要分為三種:1.移動終端顯示器(俗稱手機VR)移動終端顯示器(手機VR)——所謂的VR眼鏡盒,只要放在手機里...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>