學習內容:?
Spark介紹、Spark應用場景 、Spark和Hadoop MR、Storm的比較和優勢 、RDD、Transformation、Action、Spark計算PageRank、Lineage、Spark模型簡介、Spark緩存策略和容錯處理、寬依賴與窄依賴、Spark配置講解、Spark集群搭建、集群搭建常見問題解決、Spark原理核心組件和常用RDD、數據本地性、任務調度、 DAGScheduler、TaskScheduler、Spark源碼解讀、性能調優、Spark和Hadoop2.x整合:Spark on Yarn原理......
學習目標:?
本部分內容全面涵蓋了Spark生態系統的概述及其編程模型,深入內核的研究,Spark on Yarn,Spark Streaming流式計算原理與實踐,Spark SQL,Spark的多語言編程以及SparkR的原理和運行