曙海教育集團
全國報名免費熱線:4008699035 微信:shuhaipeixun
或15921673576(微信同號) QQ:1299983702
首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業
 
Spark和Python通過PySpark處理大數據培訓
 
   班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號)
       每期人數限3到5人。
   上課時間和地點
開課地址:【上?!客瑵髮W(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領館區1號【沈陽分部】:沈陽理工大學【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學院 【南京分部】:金港大廈
最新開班 (連續班 、周末班、晚班):2020年3月16日
   實驗設備
     ☆資深工程師授課
        
        ☆注重質量 ☆邊講邊練

        ☆合格學員免費推薦工作
        ★實驗設備請點擊這兒查看★
   質量保障

        1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
        2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
        3、培訓合格學員可享受免費推薦就業機會。

課程大綱
 
  • 了解大數據
  • Spark概述
  • Python概述
  • PySpark概述
  • 使用彈性分布式數據集框架分發數據
    使用Spark API運算符分布計算
    設置Python和Spark
  • 設置PySpark
  • 針對Spark使用Amazon Web Services(AWS)EC2實例
  • 設置數據塊
  • 設置AWS EMR集群
  • 學習Python編程的基礎知識
  • Python入門
    使用Jupyter Notebook
    使用變量和簡單的數據類型
    使用列表
    使用 if 語句
    使用用戶輸入
    處理while循環
    實現函數
    使用類
    處理文件和異常
    處理項目、數據、API
    學習Spark DataFrame的基礎知識
  • Spark DataFrames入門
    用Spark實現基本操作
    使用Groupby和聚合操作
    使用時間戳和日期
    進行Spark DataFrame項目練習
  • 了解用MLlib進行機器學習
  • 使用MLlib、Spark和Python進行機器學習
  • 了解回歸
  • 學習線性回歸理論
    實現回歸評估代碼
    進行線性回歸示例練習
    學習Logistic回歸理論
    實現一個Logistic回歸代碼
    進行Logistic回歸示例練習
    了解隨機森林(Random Forests)和決策樹(Decision Trees)
  • 學習樹方法論(Tree Methods Theory)
    實現決策樹和隨機森林代碼
    進行隨機森林分類示例練習
    使用K均值聚類
  • 了解K均值聚類理論
    實現K均值聚類代碼
    進行群集示例練習
    使用推薦系統
  • 實現自然語言處理
  • 理解自然語言處理(NLP)
    NLP工具概述
    進行NLP示例練習
    在Python中用Spark進行流式處理
  • 用Spark進行流式處理概述
    Spark流數據處理(Spark Streaming)示例練習
 
 
  備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)....................
a日韩av网址