班級規(guī)模及環(huán)境--熱線:4008699035 手機(jī):15921673576( 微信同號) |
每期人數(shù)限3到5人。 |
上課時間和地點 |
上課地點:【上?!浚和瑵?jì)大學(xué)(滬西)/新城金郡商務(wù)樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學(xué)成教院 【北京分部】:北京中山學(xué)院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領(lǐng)館區(qū)1號(中和大道) 【沈陽分部】:沈陽理工大學(xué)/六宅臻品 【鄭州分部】:鄭州大學(xué)/錦華大廈 【石家莊分部】:河北科技大學(xué)/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協(xié)同大廈
最近開課時間(周末班/連續(xù)班/晚班):2020年3月16日 |
實驗設(shè)備 |
☆資深工程師授課
☆注重質(zhì)量
☆邊講邊練
☆合格學(xué)員免費推薦工作
★實驗設(shè)備請點擊這兒查看★ |
質(zhì)量保障 |
1、培訓(xùn)過程中,如有部分內(nèi)容理解不透或消化不好,可免費在以后培訓(xùn)班中重聽;
2、培訓(xùn)結(jié)束后,授課老師留給學(xué)員聯(lián)系方式,保障培訓(xùn)效果,免費提供課后技術(shù)支持。
3、培訓(xùn)合格學(xué)員可享受免費推薦就業(yè)機(jī)會。 |
課程大綱 |
課程模塊 課程主題 主要內(nèi)容(內(nèi)容可以根據(jù)學(xué)員的要求可以現(xiàn)場調(diào)整)
模塊一 Spark
生態(tài)介紹 ? Mapreduce、storm和spark模型的比較和使用場景介紹
? Spark產(chǎn)生背景
? Spark(內(nèi)存計算框架)
? SparkSteaming(流式計算框架)
? Spark SQL(ad-hoc)
? Mllib(MachineLearning)
? GraphX(bagel將被代)
? DlinkDB介紹
? SparkR介紹
模塊二 Spark
安裝部署 ? Spark安裝簡介
? Spark的源碼編譯
? Spark Standalone安裝
? Spark應(yīng)用程序部署工具spark-submit
? Spark的高可用性部署
模塊三 Spark
運行架構(gòu)和解析 ? Spark的運行架構(gòu)
? 基本術(shù)語
? 運行架構(gòu)
? Spark on Standalone運行過程
? Spark on YARN 運行過程
? Spark運行實例解析
? Spark on Standalone實例解析
? Spark on YARN實例解析
? 比較 Standalone與YARN模式下的優(yōu)缺點
模塊四 Spark
scala編程 ? Scala基本語法與高階語法
? Scala基本語法
? Scala開發(fā)環(huán)境搭建
? Scala開發(fā)Spark應(yīng)用程序
? 使用java編程
? 使用scala編程
? 使用python編程
模塊五 Spark
編程模型和解析 ? Spark的編程模型
? Spark編程模型解析
? RDD的特點、操作、依賴關(guān)系
? Spark應(yīng)用程序的配置
? Spark的架構(gòu)
? spark的容錯機(jī)制
? 數(shù)據(jù)的本地性
? 緩存策略介紹
寬依賴與窄依賴
模塊六 Spark 數(shù)據(jù)挖掘 ? Mllib的介紹
? graphX核心原理
? table operator和graph operator區(qū)別
? vertices、edges和triplets介紹
? 構(gòu)建一個graph
? SparkR原理
? SparkR實戰(zhàn)
模塊七 Spark Streaming原理和實踐 ? Spark Streaming與Strom的區(qū)別
? Kafka的部署
? Kafka與Spark Streaming的整合
? Spark Streaming原理
? Spark流式處理架構(gòu)
? DStream的特點
? Dstream的操作和RDD的區(qū)別
? 帶狀態(tài)的transformation與無狀態(tài)transformation
? Spark Streaming的優(yōu)化
? Spark Streaming實例
? Streaming的容錯機(jī)制
? streaming在yarn模式下的注意事項
對于需結(jié)合第三方存儲機(jī)制的與流式處理方案
? 文本實例
? 網(wǎng)絡(luò)數(shù)據(jù)處理
? Kafka+Spark Streaming實現(xiàn)日志的實時分析案例
模塊八 Spark的優(yōu)化 ? 序列化優(yōu)化——Kryo
? Spark參數(shù)優(yōu)化實戰(zhàn)
? Spark 任務(wù)的均勻分布策略
? Partition key傾斜的解決方案
? Spark任務(wù)的監(jiān)控
? GC的優(yōu)化
? Spark Streaming吞吐量優(yōu)化
? Spark RDD使用內(nèi)存的優(yōu)化策略
? Spark在使用中的感想分享
模塊九 Spark的數(shù)據(jù)源 ? Spark與HDFS的整合
? HDFS RDD原理和實現(xiàn)
? Spark與Hbase的整合
? Spark與Cassendera整合
? Hbase RDD的分區(qū)讀取
? Hbase RDD的原理和實現(xiàn)
? Spark parallelism RDD的工作機(jī)制
模塊十 Spark Streaming應(yīng)用及案例分析 ? Spark Streaming產(chǎn)生動機(jī)
???Spark Streaming程序設(shè)計
(1)創(chuàng)建DStream
(2)基于DStream進(jìn)行流式處理
? Spark Streaming容錯與性能優(yōu)化
(1)Spark Streaming容錯機(jī)制
(2)如何對spark Streaming進(jìn)行優(yōu)化
???Spark Streaming案例分析
基于Spark Streaming的用戶標(biāo)簽系統(tǒng),內(nèi)容包括項目背景,項目架構(gòu)以及實施方法
模塊十一 典型項目
案例實戰(zhàn) ? 基于spark日志分析
? 個性化推薦系統(tǒng):帶你揭開其神秘面紗
? 在線投放引擎
? 揭開淘寶點擊推薦系統(tǒng)的神秘面紗
? 淘寶數(shù)據(jù)服務(wù)架構(gòu)—實時計算平臺
|