
大數(shù)據(jù)技術(shù)原理與應(yīng)用項(xiàng)目實(shí)戰(zhàn)培訓(xùn)
1 Spark MLLib
1.1 基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)
1.2 機(jī)器學(xué)習(xí)庫(kù)MLLib概述
1.3 基本數(shù)據(jù)類(lèi)型
1.4 機(jī)器學(xué)習(xí)流水線
1.5 特征提取、轉(zhuǎn)換和選擇
1.6 分類(lèi)算法
1.7 聚類(lèi)算法
1.8 協(xié)同過(guò)濾算法
1.9 模型選擇和超參數(shù)調(diào)整
1.10 將結(jié)果導(dǎo)入到Mysql
2 于Hadoop技術(shù)的用戶(hù)行為分析案例
2.1 數(shù)據(jù)預(yù)處理
2.2 上傳數(shù)據(jù)至Hive
2.3 數(shù)據(jù)分析
2.4 導(dǎo)出分析結(jié)果至Mysql
3 基于Spark技術(shù)的交易數(shù)據(jù)分析與回頭客預(yù)測(cè)案例
3.1 對(duì)文本文件形式的原始數(shù)據(jù)集進(jìn)行預(yù)處理
3.2 把文本文件的數(shù)據(jù)集導(dǎo)入到數(shù)據(jù)倉(cāng)庫(kù)HDFS中
3.3 支持向量機(jī)SVM分類(lèi)器預(yù)測(cè)回頭客分析