曙海教育集團
全國報名免費熱線:4008699035 微信:shuhaipeixun
或15921673576(微信同號) QQ:1299983702
首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業
 
Spark深入淺出企業級最佳實踐培訓

 
  班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號)
      每個班級的人數限3到5人,互動授課, 保障效果,小班授課。
  上間和地點
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈
最近開間(周末班/連續班/晚班):2019年1月26日
  實驗設備
    ◆小班教學,教學效果好
       
       ☆注重質量☆邊講邊練

       ☆合格學員免費推薦工作
       ★實驗設備請點擊這兒查看★
  質量保障

       1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
       2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
       3、培訓合格學員可享受免費推薦就業機會?!詈细駥W員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。

部份程大綱
 
  • 培訓內容
    第一部分
    1、Spark的架構設計
    1.1 Spark生態系統剖析
    1.2 Spark的架構設計剖析
    1.3 RDD計算流程解析
    1.4 Spark的出色容錯機制
    2、Spark編程模型
    2.1 RDD
    2.2 transformation
    2.3 action
    2.4 lineage
    2.5寬依賴與窄依賴
    3、深入Spark內核
    3.1 Spark集群
    3.2 任務調度
    3.3 DAGScheduler
    3.4 TaskScheduler
    3.5 Task內部揭秘
    4、Spark的廣播變量與累加器
    4.1 廣播變量的機制
    4.2 廣播變量使用最佳實踐
    4.3 累加器的機制
    4.4 累加器使用的最佳實踐
    5、編寫Spark程序
    5.1 程序數據的來源:File、HDFS、HBase、S3等
    5.2 IDE環境構建
    5.3 Maven
    5.4 sbt.
    5.5 編寫并部署Spark程序的實例
    6、SparkContext解析和數據加載以及存儲
    6.1 源碼剖析SparkContext
    6.2 Scala、Java、Python使用SparkContext
    6.4 加載數據成為RDD
    6.5 把數據物化
    第二部分
    7、深入實戰RDD
    7.1 DAG
    7.2 深入實戰各種Scala RDD Function
    7.3 Spark Java RDD Function
    7.4 RDD的優化問題
    8、Shark的原理和使用
    8.1 Shark與Hive
    8.2 安裝和配置Shark
    8.3 使用Shark處理數據
    8.4 在Spark程序中使用Shark Queries
    8.5 SharkServer
    8.6 思考Shark架構
    9、Spark的機器學習
    9.1 LinearRegression
    9.2 K-Means
    9.3 Collaborative Filtering
    10、Spark的圖計算GraphX
    10.1 Table Operators
    10.2 Graph Operators
    10.3 GraphX
    11、Spark SQL
    11.1 Parquet支持
    11.2 DSL
    11.3 SQL on RDD
    第三部分
    12、Spark實時流處理
    12.1 DStream
    12.2 transformation
    12.3 checkpoint
    12.4 性能優化
    13、Spark程序的測試
    13.1 編寫可測試的Spark程序
    13.2 Spark測試框架解析
    13.3 Spark測試代碼實戰
    14、Spark的優化
    14.1 Logs
    14.2 并發
    14.3 內存
    14.4 垃圾回收
    14.5 序列化
    14.6 安全
    15、Spark on Yarn
    15.1 Spark on Yarn的架構原理
    15.2 Spark on Yarn的最佳實踐
    16、JobServer
    16.1 JobServer的架構設計
    16.2 JobServer提供的接口
    16.3 JobServer最佳實踐
 

-

 

  備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)...............
a日韩av网址