班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
開課地址:【上?!客瑵髮W(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領館區1號【沈陽分部】:沈陽理工大學【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學院 【南京分部】:金港大廈
最新開班 (連續班 、周末班、晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
|
課程目標
掌握Python數據挖掘流程,熟練使用Python庫進行建模分析。
適用人群
熟悉Python準備從事數據領域的同學們
課程簡介
Python數據挖掘系列課程基于真實數據集進行案例實戰,使用Python數據科學庫從數據預處理開始一步步進行數據建模。對于每個案例首先進行流程解讀與數據分析,建立特征工程,詳細解讀其中每一步原理與應用
第1章泰坦尼克號獲救預測
1-1數據挖掘任務流程
1-2數據介紹
1-3Python兵器庫介紹
1-4sklearn庫介紹
1-5數據讀取與統計分析
1-6性別特征分析
1-7船艙等級特征分析
1-8缺失值問題
1-9年齡缺失值填充與分析
1-10登船地點特征分析
1-11家庭特征分析
1-12特征相關性
1-13構建特征
1-14機器學習算法概述
1-15交叉驗證
1-16多種機器學習算法模型效果
1-17集成模塊
1-18特征重要性衡量
1-19總結與特征預處理
第2章用戶畫像
2-1用戶畫像概述
2-2如何建立用戶畫像
2-3用戶搜索數據介紹
2-4任務概述與方案
2-5構造詞向量特征
2-6構造輸入特征
2-7建立預測模型
第3章Xgboost實戰
3-1Xgboost算法概述
3-2Xgboost模型構造
3-3Xgboost建模衡量標準
3-4Xgboost安裝
3-5保險賠償任務概述
3-6Xgboost參數定義
3-7基礎模型定義
3-8樹結構對結果的影響
3-9學習率與采樣對結果的影響
第4章用電敏感客戶分類
4-1任務概述與解決框架
4-2特征工程分析與特征提取
4-3離散數據處理
4-4統計與文本特征
4-5文本特征構建
4-6構建低敏用戶模型
4-7高敏模型概述
第5章BenchMark與論文的作用
5-1HTTP檢測任務與數據挖掘的核心
5-2論文的重要程度
5-3BenchMark概述
5-4BenchMark的作用
第6章京東購買意向預測
6-1項目與數據介紹
6-2數據挖掘流程
6-3數據檢查
6-4構建用戶特征表單
6-5構建商品特征表單
6-6數據探索概述
6-7購買因素分析
6-8特征工程
6-9基本特征構造
6-10行為特征
6-11累計行為特征
6-12Xgboost模型
第7章kaggle數據科學調查
7-1kaggle數據科學調查介紹
7-2基本情況可視化展
7-3工資情況
7-4技能使用情況
7-5數據集與平臺
7-6Python與R哪家強
7-7調查總結
第8章房價預測
8-1房價預測任務概述
8-2離散型數據
8-3數據對數變換
8-4缺失值處理與box-cox變換
8-5模型預測
第9章fbprophet時間序列預測
9-1fbprophet股價預測任務概述
9-2時間序列分析
9-3fbprophet時間序列預測實例
9-4亞馬遜股價趨勢
9-5突變點調參
|