
Hadoop 數(shù)據(jù)導(dǎo)入與導(dǎo)出培訓(xùn)
一個(gè)經(jīng)典的數(shù)據(jù)架構(gòu)中,Hadoop 是處理復(fù)雜數(shù)據(jù)流的核心。
數(shù)據(jù)往往是從許多分散的系統(tǒng)中收集而來(lái),并導(dǎo)入 Hadoop 分布式文件系統(tǒng)(HDFS)中,
通過(guò) MapReduce 或者其他基于 MapReduce 封裝的語(yǔ)言進(jìn)行處理。
1
導(dǎo)入和導(dǎo)出數(shù)據(jù)
1.使用Hadoopshell命令導(dǎo)入和導(dǎo)出數(shù)據(jù)到HDFS
2.Pig腳本來(lái)演示下getmerge命令的功能
3.使用distcp實(shí)現(xiàn)集群間數(shù)據(jù)復(fù)制
4.使用Sqoop從MySQL數(shù)據(jù)庫(kù)導(dǎo)入數(shù)據(jù)到HDFS
5.使用Sqoop從HDFS導(dǎo)出數(shù)據(jù)到MySQL

請(qǐng)
登錄
后發(fā)表評(píng)論
新評(píng)論
全部
第1節(jié)
第2節(jié)
第3節(jié)
第4節(jié)
第5節(jié)
第6節(jié)
第7節(jié)
第8節(jié)
第9節(jié)
第10節(jié)
第11節(jié)
第12節(jié)
第13節(jié)
第14節(jié)
第15節(jié)
第16節(jié)
第17節(jié)
我的報(bào)告 / 所有報(bào)告