班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號) |
每期人數(shù)限3到5人。 |
上課時間和地點 |
開課地址:【上?!客瑵髮W(滬西)/新城金郡商務(wù)樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領(lǐng)館區(qū)1號【沈陽分部】:沈陽理工大學【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學院 【南京分部】:金港大廈
最新開班 (連續(xù)班 、周末班、晚班):2020年3月16日 |
實驗設(shè)備 |
☆資深工程師授課
☆注重質(zhì)量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設(shè)備請點擊這兒查看★ |
質(zhì)量保障 |
1、培訓過程中,如有部分內(nèi)容理解不透或消化不好,可免費在以后培訓班中重聽;
2、培訓結(jié)束后,授課老師留給學員聯(lián)系方式,保障培訓效果,免費提供課后技術(shù)支持。
3、培訓合格學員可享受免費推薦就業(yè)機會。 |
課程大綱 |
|
- 了解大數(shù)據(jù)
- Spark概述
- Python概述
- PySpark概述
- 使用彈性分布式數(shù)據(jù)集框架分發(fā)數(shù)據(jù)
使用Spark API運算符分布計算
設(shè)置Python和Spark
- 設(shè)置PySpark
- 針對Spark使用Amazon Web Services(AWS)EC2實例
- 設(shè)置數(shù)據(jù)塊
- 設(shè)置AWS EMR集群
- 學習Python編程的基礎(chǔ)知識
- Python入門
使用Jupyter Notebook
使用變量和簡單的數(shù)據(jù)類型
使用列表
使用 if 語句
使用用戶輸入
處理while循環(huán)
實現(xiàn)函數(shù)
使用類
處理文件和異常
處理項目、數(shù)據(jù)、API
學習Spark DataFrame的基礎(chǔ)知識
- Spark DataFrames入門
用Spark實現(xiàn)基本操作
使用Groupby和聚合操作
使用時間戳和日期
進行Spark DataFrame項目練習
- 了解用MLlib進行機器學習
- 使用MLlib、Spark和Python進行機器學習
- 了解回歸
- 學習線性回歸理論
實現(xiàn)回歸評估代碼
進行線性回歸示例練習
學習Logistic回歸理論
實現(xiàn)一個Logistic回歸代碼
進行Logistic回歸示例練習
了解隨機森林(Random Forests)和決策樹(Decision Trees)
- 學習樹方法論(Tree Methods Theory)
實現(xiàn)決策樹和隨機森林代碼
進行隨機森林分類示例練習
使用K均值聚類
- 了解K均值聚類理論
實現(xiàn)K均值聚類代碼
進行群集示例練習
使用推薦系統(tǒng)
- 實現(xiàn)自然語言處理
- 理解自然語言處理(NLP)
NLP工具概述
進行NLP示例練習
在Python中用Spark進行流式處理
- 用Spark進行流式處理概述
Spark流數(shù)據(jù)處理(Spark Streaming)示例練習
|