課程名稱:Hadoop 數據導入與導出培訓

4401 人關注
(78637/99817)
課程大綱:

Hadoop 數據導入與導出培訓

 

 

一個經典的數據架構中,Hadoop 是處理復雜數據流的核心。

數據往往是從許多分散的系統中收集而來,

并導入 Hadoop 分布式文件系統(HDFS)中,

通過 MapReduce 或者其他基于 MapReduce 封裝的語言進行處理。

1
導入和導出數據

1.使用Hadoopshell命令導入和導出數據到HDFS

2.Pig腳本來演示下getmerge命令的功能

3.使用distcp實現集群間數據復制

4.使用Sqoop從MySQL數據庫導入數據到HDFS

5.使用Sqoop從HDFS導出數據到MySQL


登錄 后發表評論
新評論
全部 第1節 第2節 第3節 第4節 第5節 第6節 第7節 第8節 第9節 第10節 第11節 第12節 第13節 第14節 第15節 第16節 第17節
我的報告 / 所有報告
a日韩av网址