
SAS電商數據挖掘培訓
1.數據挖掘與統計分析:
1.1 驗證性還是探索性
1.2 問題如何量化
1.3 數據量(行、質量、列、重復利用) ;
1.4 時間、精確度與商業價值的折中
1.5 模型的相關性側重
1.6 分析流程中側重點的轉移
1.7 圖表與報告展示
1.8 SEMMA 分析流程——sample、explore、modify、model、assess
2.數據挖掘軟件簡介
2.1 sas(em) 、spss(modeler)
2.2 python、weka、intelligent miner
2.3 r、sqlserver、hadoop
3. 數據源:訪問數據庫及其不同文件格式
3.1 訪問文本、Excel 文件
3.2 訪問常用統計軟件的文件格式
3.3 訪問數據庫(Oracle、mysql 等)
3.4SAS 數據源 DMDB;
4. RFM 價值模型;
4.1 直方圖或散點圖描述數據;
4.2 抽樣:限制樣本量;
4.3 分箱:數據離散化;
4.4 圖形(熱圖)與制表:對 RFM 結果進行評價。
5. 預測分析:DM 回歸與 logistic、神經網絡、決策樹;
5.1 案例 1:庫存的優化方案(DM 回歸和神經網絡)
5.2 案例 2:客戶流失模型(神經網絡)
5.3 案例 3:客戶重構分析(logistic)
5.4 案例 4:基于訂購行為的營銷分析(決策樹)
6. 關聯分析:購物籃分析
6.1 案例 1:購物籃分析及商品優結構特征優化;
6.2 案例 2:購物序列分析及購買推斷;
7. 市場細分:聚類分析
7.1 案例 1:細分客戶特征及異常檢測
7.2 案例 2:大樣本之兩步聚類
8. 組合模型:評價及整合分析
8.1 案例 1:用戶行為偏好的組合預測;
8.2 案例 2:用戶行為偏好的模型整合分析;