
大數(shù)據(jù)技術原理與應用項目實戰(zhàn)培訓
1 Spark MLLib
1.1 基于大數(shù)據(jù)的機器學習
1.2 機器學習庫MLLib概述
1.3 基本數(shù)據(jù)類型
1.4 機器學習流水線
1.5 特征提取、轉換和選擇
1.6 分類算法
1.7 聚類算法
1.8 協(xié)同過濾算法
1.9 模型選擇和超參數(shù)調(diào)整
1.10 將結果導入到Mysql
2 于Hadoop技術的用戶行為分析案例
2.1 數(shù)據(jù)預處理
2.2 上傳數(shù)據(jù)至Hive
2.3 數(shù)據(jù)分析
2.4 導出分析結果至Mysql
3 基于Spark技術的交易數(shù)據(jù)分析與回頭客預測案例
3.1 對文本文件形式的原始數(shù)據(jù)集進行預處理
3.2 把文本文件的數(shù)據(jù)集導入到數(shù)據(jù)倉庫HDFS中
3.3 支持向量機SVM分類器預測回頭客分析