班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數限3到5人。 |
上課時間和地點 |
上課地點:【上?!浚和瑵髮W(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協同大廈
最近開課時間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
3、培訓合格學員可享受免費推薦就業機會。 |
課程大綱 |
|
數據倉庫培訓課程大綱:
第一部分:
第1個主題:云計算的四大核心技術
HDFS、MapReduce、HBase、Hive
第2個主題:Hive集群與管理
1、Hadoop集群的搭建
2、Hadoop集群的監控
3、Hadoop集群的管理
4、集群下運行MapReduce程序
5、安裝并啟動Hive
6、測試Hive
第3主題:Hive的命令、數據類型和文件格式
1、Hive的CLI
2、Hive的集合數據類型
3、編碼和模式
第4主題:開發Hive
1. 連接Java調試器到Hive
2. 通過Eclipse來開發Hive代碼
3. Hive的單元測試
第5題:HQL
1. HQL的數據定義
2. 使用HQL操作數據
3. 深入HQL查詢
第6題:HQL的視圖和索引
1、HQL的視圖:降低查詢的復雜度和限定特定的條件
2、HQL的索引:索引的創建和管理、定制索引
第二部分:
第1個主題:Hive中的函數
1. 使用Hive中已有的函數
2. 自定義聚合函數
3. 自定義表生成函數
4. 在自定義函數中訪問緩存
第2個主題:Hive的存儲過程
1、為何需要Hive中的存儲過程
2、 在后臺中運行的存儲過程
3、HiveStorageHandler
4、 存儲過程的具體編寫和使用
第3個主題:Hive架構優化
1、 降低IO負載
2、 表的分區、動態分區
3、 壓縮
4、分布式緩存
第4個主題:徹底優化HQL
1、 HQL優化的具體策略和方式
2、 Map和Reduce
3、數據傾斜
4,執行計劃
第5個主題:在AWS上使用Hive
1. 使用并管理EMR Hive集群
2. EMR集群的詳細配置
3.持久層、元數據
4.集群中的HDFS和S3(配置、日志等)
第6個主題:Hive的Thrift
1. 配置、啟動、使用Thrift
2. Thrift的管理
3. 管理Hive Server
4.ThriftMetaStore

|