曙海教育集團
全國報名免費熱線:4008699035 微信:shuhaipeixun
或15921673576(微信同號) QQ:1299983702
首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業
 
Spark項目實戰課程培訓
 
   班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號)
       每期人數限3到5人。
   上課時間和地點
開課地址:【上?!客瑵髮W(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領館區1號【沈陽分部】:沈陽理工大學【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學院 【南京分部】:金港大廈
最新開班 (連續班 、周末班、晚班):2020年3月16日
   實驗設備
     ☆資深工程師授課
        
        ☆注重質量 ☆邊講邊練

        ☆合格學員免費推薦工作
        ★實驗設備請點擊這兒查看★
   質量保障

        1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
        2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
        3、培訓合格學員可享受免費推薦就業機會。

課程大綱
 
  • 第1章Spark中決策樹相關算法
    1-1回顧決策樹
    1-2信息增益的計算
    1-3參數maxBins含義
    1-4其他重要參數講解
    1-5類別值轉換處理
    1-6構建決策樹分類模型
    1-7模型訓練以及debug
    1-8構建決策樹回歸模型
    1-9Spark中的梯度提升樹
    1-10性能提升參數
    1-11Spark中的隨機森林模型實現
    第2章運動數據分類
    2-1業務場景定義
    2-2加載數據
    2-3探索每一種活動類型數據分布情況
    2-4計算每一行的NAN個數
    2-5計算NAN的占比
    2-6找出NAN值太多的無效行
    2-7每一列缺失值的探索
    2-8心率缺失值的處理
    2-9其他字段缺失值的處理
    2-10統一數據
    2-11對activityId進行索引標記
    2-12特征值中類別值的索引標記
    2-13模型訓練
    2-14模型的debug
    2-15模型評估
    2-16混淆矩陣
    2-17計算正確率
    2-18混淆矩陣的label
    2-19計算精確率和召回率
    2-20模型部署
 
  備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)....................
a日韩av网址