
SAS電商數(shù)據(jù)挖掘培訓(xùn)
1.?dāng)?shù)據(jù)挖掘與統(tǒng)計(jì)分析:
1.1 驗(yàn)證性還是探索性
1.2 問題如何量化
1.3 數(shù)據(jù)量(行、質(zhì)量、列、重復(fù)利用) ;
1.4 時(shí)間、精確度與商業(yè)價(jià)值的折中
1.5 模型的相關(guān)性側(cè)重
1.6 分析流程中側(cè)重點(diǎn)的轉(zhuǎn)移
1.7 圖表與報(bào)告展示
1.8 SEMMA 分析流程——sample、explore、modify、model、assess
2.數(shù)據(jù)挖掘軟件簡(jiǎn)介
2.1 sas(em) 、spss(modeler)
2.2 python、weka、intelligent miner
2.3 r、sqlserver、hadoop
3. 數(shù)據(jù)源:訪問數(shù)據(jù)庫及其不同文件格式
3.1 訪問文本、Excel 文件
3.2 訪問常用統(tǒng)計(jì)軟件的文件格式
3.3 訪問數(shù)據(jù)庫(Oracle、mysql 等)
3.4SAS 數(shù)據(jù)源 DMDB;
4. RFM 價(jià)值模型;
4.1 直方圖或散點(diǎn)圖描述數(shù)據(jù);
4.2 抽樣:限制樣本量;
4.3 分箱:數(shù)據(jù)離散化;
4.4 圖形(熱圖)與制表:對(duì) RFM 結(jié)果進(jìn)行評(píng)價(jià)。
5. 預(yù)測(cè)分析:DM 回歸與 logistic、神經(jīng)網(wǎng)絡(luò)、決策樹;
5.1 案例 1:庫存的優(yōu)化方案(DM 回歸和神經(jīng)網(wǎng)絡(luò))
5.2 案例 2:客戶流失模型(神經(jīng)網(wǎng)絡(luò))
5.3 案例 3:客戶重構(gòu)分析(logistic)
5.4 案例 4:基于訂購行為的營(yíng)銷分析(決策樹)
6. 關(guān)聯(lián)分析:購物籃分析
6.1 案例 1:購物籃分析及商品優(yōu)結(jié)構(gòu)特征優(yōu)化;
6.2 案例 2:購物序列分析及購買推斷;
7. 市場(chǎng)細(xì)分:聚類分析
7.1 案例 1:細(xì)分客戶特征及異常檢測(cè)
7.2 案例 2:大樣本之兩步聚類
8. 組合模型:評(píng)價(jià)及整合分析
8.1 案例 1:用戶行為偏好的組合預(yù)測(cè);
8.2 案例 2:用戶行為偏好的模型整合分析;