
Python mrjob 操作 Hadoop培訓(xùn)
Python是做數(shù)據(jù)分析好的語(yǔ)言。
大數(shù)據(jù)當(dāng)然也離不開(kāi)Hadoop,
Hadoop由JAVA寫(xiě)成,
但Python也可以很好地操控它。
本課程介紹了Python中MRjob模塊,
通過(guò)該模塊,
可以讓開(kāi)發(fā)者非常簡(jiǎn)單的通過(guò)Python來(lái)使用Hadoop進(jìn)行數(shù)據(jù)分析。
1 Python MRJob模塊的安裝
2 使用MRJob實(shí)現(xiàn)文本統(tǒng)計(jì)
3 重寫(xiě)MRJob函數(shù)實(shí)現(xiàn)復(fù)雜數(shù)據(jù)處理
4 Hadoop——Python各模塊介紹
5 Python MRJob的運(yùn)行方式
1
Python玩轉(zhuǎn)Hadoop之MRjob入門(mén)
1.PythonMRJob模塊的安裝
2.HadoopPython各模塊介紹
3.使用MRJob實(shí)現(xiàn)文本統(tǒng)計(jì)
4.PythonMRJob的運(yùn)行方式
5.重寫(xiě)MRJob函數(shù)實(shí)現(xiàn)復(fù)雜數(shù)據(jù)處理
1 使用 mrjob 實(shí)現(xiàn)詞組統(tǒng)計(jì)
2 實(shí)戰(zhàn)模擬 - 統(tǒng)計(jì)每部電影的熱度
3 實(shí)戰(zhàn)模擬 - 統(tǒng)計(jì)每部電影的觀看用戶(hù)列表
4 實(shí)戰(zhàn)模擬 - 統(tǒng)計(jì)每個(gè)用戶(hù)的觀影列表
