
R做數(shù)據(jù)分析及挖掘培訓(xùn)
第一章:統(tǒng)計(jì)基礎(chǔ)
第一節(jié):描述性統(tǒng)計(jì)
1、集中趨勢(shì)
2、離散測(cè)度
第二節(jié):統(tǒng)計(jì)量及其抽樣分布
1、統(tǒng)計(jì)量
2、分布
3、樣本均值的分布與中心極限定理
4、樣本比例的抽樣分布
5、兩個(gè)樣本均值之差的抽樣分布
6、關(guān)于樣本方差的分布
第三節(jié):參數(shù)估計(jì)
1、參數(shù)估計(jì)
2、一個(gè)總體參數(shù)的區(qū)間估計(jì)
3、兩個(gè)總體參數(shù)的區(qū)間估計(jì)
4、估計(jì)量的求法
5、樣本量的確定
第四節(jié):假設(shè)檢驗(yàn) ?
1、假設(shè)檢驗(yàn)、個(gè)樣本t檢驗(yàn)
2、配對(duì)樣本的t檢驗(yàn)、兩獨(dú)立樣本t檢驗(yàn)
第五節(jié):分類數(shù)據(jù)分析
1、分類數(shù)據(jù)與卡方統(tǒng)計(jì)量
2、擬合優(yōu)度檢驗(yàn)
3、列聯(lián)分析、獨(dú)立性檢驗(yàn)
4、列聯(lián)分析相關(guān)測(cè)量
5、線性回歸
第六節(jié):矩陣運(yùn)算
1、行列式
2、矩陣及其運(yùn)算
3、矩陣的初等變換與線性方程組
4、向量組的線性相關(guān)性
5、相似矩陣
6、線性空間與線性變化
第二章:R編程基礎(chǔ)
第一節(jié):R基本知識(shí)
1、準(zhǔn)備、數(shù)據(jù)對(duì)象
2、運(yùn)算、讀寫
第二節(jié):R基本語(yǔ)句結(jié)構(gòu)及循環(huán)
1、語(yǔ)句結(jié)構(gòu)、創(chuàng)建
2、循環(huán)函數(shù)
第三節(jié):R數(shù)據(jù)清洗
1、時(shí)間、數(shù)據(jù)清洗
2、數(shù)據(jù)清洗
第四節(jié):文本對(duì)象處理
1、文本對(duì)象處理
2、正則表達(dá)式
第五節(jié):R畫圖
1、基本繪圖,圖像格式
2、ggplot2
3、目前好用的擴(kuò)展
第六節(jié):R統(tǒng)計(jì)分析
1、參數(shù)估計(jì)
2、假設(shè)檢驗(yàn)
第三章:R數(shù)據(jù)挖掘
第一節(jié):線性回歸,邏輯回歸,梯度下降,聚類,關(guān)聯(lián)規(guī)則,主成分因子分析
第二節(jié):關(guān)聯(lián)規(guī)則,決策樹,神經(jīng)網(wǎng)絡(luò),貝葉斯,支持向量機(jī),隨機(jī)森林
第四章:數(shù)據(jù)挖掘案例
第一節(jié):如何在保險(xiǎn)行業(yè)中使用決策樹并展示其成果
第二節(jié):如何在保險(xiǎn)行業(yè)中使用決策樹并展示其成果
第三節(jié):如何利用客戶分群實(shí)現(xiàn)保險(xiǎn)行業(yè)中潛在客戶的精準(zhǔn)定位(K-means)
第四節(jié):基于關(guān)聯(lián)規(guī)則和協(xié)同過濾算法的商品個(gè)性化推薦