亚洲国产天堂久久综合226114,亚洲va中文字幕无码毛片,亚洲av无码片vr一区二区三区,亚洲av无码乱码在线观看,午夜爽爽爽男女免费观看影院

課程目錄: R語(yǔ)言數(shù)據(jù)挖掘?qū)崙?zhàn)培訓(xùn)|
(78637/99817)
課程大綱:

     R語(yǔ)言數(shù)據(jù)挖掘?qū)崙?zhàn)培訓(xùn)

 

 

 

第1節(jié)
R語(yǔ)言數(shù)據(jù)對(duì)象概要
通過(guò)創(chuàng)建不同的對(duì)象(數(shù)據(jù)對(duì)象、圖形對(duì)象、模型對(duì)象、自定義方程)詳細(xì)介紹了在R語(yǔ)言中萬(wàn)物皆對(duì)象的說(shuō)法,通過(guò)實(shí)際案例演示了如何創(chuàng)建向量、矩陣、數(shù)組、數(shù)據(jù)框和列表等數(shù)據(jù)對(duì)象。
學(xué)員學(xué)習(xí)完本小節(jié)的內(nèi)容,懂得R語(yǔ)言中的常用數(shù)據(jù)對(duì)象創(chuàng)建、判斷和轉(zhuǎn)換的方法,為以后的數(shù)據(jù)分析和處理打下堅(jiān)實(shí)的基礎(chǔ)。
第2節(jié)
R語(yǔ)言數(shù)據(jù)導(dǎo)入概要

R語(yǔ)言沒(méi)有提供圖形化的數(shù)據(jù)導(dǎo)入界面,本小節(jié)利用RStuido導(dǎo)入外部的txt、csv文件;也介紹了利用read.table函數(shù)導(dǎo)入txt、csv文件數(shù)據(jù);讓學(xué)員對(duì)外部文本文件數(shù)據(jù)導(dǎo)入到R有基本的能力。

第3節(jié)
距離計(jì)算及數(shù)據(jù)標(biāo)準(zhǔn)化處理
本小節(jié)介紹了連續(xù)型變量間距離的計(jì)算方式;介紹了數(shù)據(jù)標(biāo)準(zhǔn)化處理的基本原理;并利用了caret擴(kuò)展包中的preProcess函數(shù)快速實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化處理,通過(guò)例子演示了利用preProcess函數(shù)和其他函數(shù)實(shí)現(xiàn)標(biāo)準(zhǔn)化和歸一化處理的結(jié)果。

第4節(jié)
常用聚類(lèi)算法原理及R語(yǔ)言實(shí)現(xiàn)

常用聚類(lèi)算法介紹,并對(duì)K均值聚類(lèi)及層次聚類(lèi)算法原理的詳細(xì)講解;后介紹了不同聚類(lèi)算法在R語(yǔ)言中對(duì)應(yīng)的函數(shù)實(shí)現(xiàn)。

第5節(jié)
聚類(lèi)分析案例演示

利用K-Means聚類(lèi)對(duì)Vehicle數(shù)據(jù)集進(jìn)行聚類(lèi)分群,并通過(guò)汽車(chē)類(lèi)型指標(biāo)查看聚類(lèi)效果;利用cluster函數(shù)對(duì)洛杉磯街區(qū)數(shù)據(jù)進(jìn)行層次聚類(lèi),并繪制聚類(lèi)系譜樹(shù)圖,并利用聚類(lèi)結(jié)果對(duì)街區(qū)進(jìn)行分群標(biāo)識(shí),在經(jīng)緯度圖上把街區(qū)數(shù)據(jù)展現(xiàn)出來(lái);后利用cluster函數(shù)對(duì)mtcars數(shù)據(jù)集進(jìn)行層次聚類(lèi),并對(duì)結(jié)果進(jìn)行詳細(xì)解讀。

第6節(jié)
關(guān)聯(lián)規(guī)則案例演示

簡(jiǎn)單介紹了關(guān)聯(lián)規(guī)則的基本原理,并詳細(xì)介紹了R語(yǔ)言關(guān)聯(lián)規(guī)則的實(shí)現(xiàn)及其他相關(guān)函數(shù);介紹了關(guān)聯(lián)規(guī)則可視化包arulesViz;后通過(guò)超市購(gòu)物數(shù)據(jù)進(jìn)行事務(wù)型數(shù)據(jù)的探索,利用as函數(shù)進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,利用itemFrequency函數(shù)查看包含該商品的交易比例;通過(guò)arules函數(shù)構(gòu)建關(guān)聯(lián)規(guī)則模型,并對(duì)關(guān)聯(lián)規(guī)則進(jìn)行排序和篩選。

第7節(jié)
KNN算法原理及R語(yǔ)言實(shí)現(xiàn)
詳細(xì)講解了KNN近鄰算法思想,KNN算法流程,如何對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化以及呀變量處理;以及KNN算法的R語(yǔ)言實(shí)現(xiàn)。

第8節(jié)
KNN算法案例詳解

利用KNN算法對(duì)鳶尾花數(shù)據(jù)集iris建立分類(lèi)器,并利用混淆矩陣查看預(yù)測(cè)誤差率,其中利用caret包的creatDataPartition函數(shù)對(duì)數(shù)據(jù)進(jìn)行分區(qū),并通過(guò)自定義函數(shù)ceshi讓學(xué)員清楚KNN近鄰算法的實(shí)現(xiàn)步驟。后利用KNN算法對(duì)乳腺癌數(shù)據(jù)識(shí)別患者,對(duì)汽車(chē)類(lèi)型進(jìn)行識(shí)別等。

第9節(jié)
決策樹(shù)算法基本原理及R語(yǔ)言實(shí)現(xiàn)

介紹了決策樹(shù)的基本思想以及其優(yōu)缺點(diǎn)。我們從理論上概述決策樹(shù)的構(gòu)建過(guò)程,這一過(guò)程包括如下四個(gè)步驟。1、決策樹(shù)的生成;2、生成樹(shù)的剪枝;3、生成規(guī)則;4、模型性能和預(yù)測(cè)。
詳細(xì)介紹了C5.0、CART算法的R語(yǔ)言實(shí)現(xiàn),并利用不同的決策樹(shù)算法對(duì)汽車(chē)類(lèi)型進(jìn)行識(shí)別。
第10節(jié)
條件推理算法決策樹(shù)的案例演示

R語(yǔ)言中的party包主要用于實(shí)現(xiàn)條件推理決策樹(shù),介紹了ctree函數(shù)的參數(shù)設(shè)置。通過(guò)運(yùn)用條件推理決策樹(shù)算法對(duì)汽車(chē)類(lèi)型進(jìn)行識(shí)別,并繪制決策樹(shù)圖進(jìn)行直觀展示。

第11節(jié)
五折交叉驗(yàn)證方法及其他機(jī)器學(xué)習(xí)算法R語(yǔ)言實(shí)現(xiàn)

介紹了評(píng)估和選擇合適的模型和算法:五折交叉驗(yàn)證的方法。并介紹了組合算法、隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)算法的R語(yǔ)言實(shí)現(xiàn)。

第12節(jié)
利用其他機(jī)器學(xué)習(xí)算法對(duì)cars數(shù)據(jù)集進(jìn)行預(yù)測(cè)

利用數(shù)據(jù)集cars作為案例演示:介紹了構(gòu)建五折交叉驗(yàn)證下標(biāo)的代碼,并通過(guò)for循環(huán)構(gòu)建五折交叉驗(yàn)證,通過(guò)對(duì)訓(xùn)練集和測(cè)試集進(jìn)行預(yù)測(cè),利用平均誤差率小原則,選擇優(yōu)模型對(duì)其他樣本進(jìn)行預(yù)測(cè)。

第13節(jié)
rattle的使用

介紹了R語(yǔ)言數(shù)據(jù)挖掘可視化工具—Rattle的主要功能。包括:數(shù)據(jù)導(dǎo)入、數(shù)據(jù)探索、數(shù)據(jù)可視化、數(shù)據(jù)建模及模型評(píng)估等操作。讓學(xué)員能利用rattle工具快速完成數(shù)據(jù)挖掘工作的目的。