91原色影院_免费av在线_中文字幕最新精品_久久精品视频99

歡迎訪問企業培訓網!本站提供優質培訓課程和培訓服務!
免費注冊 | 會員登陸 | 將本站設為首頁 |

大數據平臺搭建與高性能計算最佳實戰

(本課程滾動開課,如遇開課時間或者地點不合適,請撥打010-62258232咨詢最新時間、地點等培訓安排!)

培訓安排:2020年4月27-30日海口   6月18-21日北京

培訓費用:6800元/人(含培訓費、場地費、資料費、學習期間午餐),食宿可統一安排,費用自理。請學員帶身份證復印件一張。

培訓收益:

通過此次課程培訓,可使學習者獲得如下收益:

1.深刻理解在“互聯網+”時代下大數據的產生背景、發展歷程和演化趨勢;

2.了解業界市場需求和國內外最新的大數據技術潮流,洞察大數據的潛在價值;

3.理解大數據項目解決方案及業界大數據應用案例,從而為企業在大數據項目中的技術選型及技術架構設計提供決策參考;

4.掌握業界最流行的Hadoop與Spark大數據技術體系;

5.掌握大數據采集技術;

6.掌握大數據分布式存儲技術;

7.掌握NoSQL與NewSQL分布式數據庫技術;

8.掌握大數據倉庫與統計機器學習技術;

9.掌握大數據分析挖掘與商業智能(BI)技術;

10.掌握大數據離線處理技術;

11.掌握Storm流式大數據處理技術;

12.掌握基于內存計算的大數據實時處理技術;

13.掌握大數據管理技術的原理知識和應用實戰;

14.深入理解大數據平臺技術架構和使用場景;

15.嫻熟運用Hadoop與Spark大數據技術體系規劃解決方案滿足實際項目需求;

16.熟練地掌握基于Hadoop與Spark大數據平臺進行應用程序開發、集群運維管理和性能調優技巧。

培訓特色:

1.課程培訓業界最流行、應用最廣泛的Hadoop與Spark大數據技術體系。強化大數據平臺的分布式集群架構和核心關鍵技術實現、大數據應用項目開發和大數據集群運維實踐、以及Hadoop與Spark大數據項目應用開發與調優的全過程沙盤模擬實戰。

2.通過一個完整的大數據開發項目及一組實際項目訓練案例,完全覆蓋Hadoop與Spark生態系統平臺的應用開發與運維實踐。課堂實踐項目以項目小組的形式進行沙盤實操練習,重點強化理解Hadoop與Spark大數據項目各個階段的工作重點,同時掌握作為大數據項目管理者的基本技術與業務素養。

3.本課程的授課師資都是有著多年在一線從事Hadoop與Spark大數據項目的資深講師,采用原理技術剖析和實戰案例相結合的方式開展互動教學、強化以建立大數據項目解決方案為主體的應用開發、技術討論與交流咨詢,在學習的同時促進講師學員之間的交流,讓每個學員都能在課程培訓過程中學到實實在在的大數據技術知識體系,以及大數據技術應用實戰技能,具備實際大數據應用項目的動手開發實踐與運維管理部署能力。授課過程中,根據學員需求,增設交流環節,可將具體工作中遇到的實際問題展開討論,講師會根據學員的實際情況微調授課內容,由講師帶著全部學員積極討論,并給出一定的時間讓學員上臺發言,現場剖析問題的癥結,規劃出可行的解決方案。

培訓大綱:

日程

培訓模塊

培訓內容

第一天

上午

大數據技術基礎

1. 大數據的產生背景與發展歷程

2. 大數據的4V特征,以及與云計算的關系

3. 大數據應用需求以及潛在價值分析

4. 業界最新的大數據技術發展態勢與應用趨勢

5. 大數據思維的轉變

6. 大數據項目的系統與技術選型,及落地實施的挑戰

7. “互聯網+”時代下的電子商務、制造業、交通行業、電信運營商、銀行金融業、電子政務、移動互聯網、教育信息化等行業應用實踐與應用案例介紹

業界主流的大數據技術方案

1. 大數據軟硬件系統全棧與關鍵技術介紹

2. 大數據生態系統全景圖

3. 主流的大數據解決方案介紹

4. Apache大數據平臺方案剖析

5. CDH大數據平臺方案剖析

6. HDP大數據平臺方案剖析

7. 基于云的大數據平臺方案剖析

8. 大數據解決方案與傳統數據庫方案比較

9. 國內外大數據平臺方案與廠商對比

大數據計算模型(一)——批處理MapReduce

1. MapReduce產生背景與適用場景

2. MapReduce計算模型的基本原理

3. MapReduce作業執行流程

4. MapReduce基本組件,JobTracker和TaskTracker

5. MapReduce高級編程應用,Combiner和Partitioner

6. MapReduce性能優化技巧

7. MapReduce案例分析與開發實踐操作

第一天

下午

大數據存儲系統與應用實踐

1. 分布式文件系統HDFS產生背景與適用場景

2. HDFS master-slave系統架構與讀寫工作原理

3. HDFS核心組件技術講解,NameNode與fsimage、editslog,DataNode與數據塊

4. HDFS Federation機制,viewfs機制,使用場景講解

5. HDFS高可用保證機制,SecondaryNameNode,NFS冷備份,基于zookeeper的HA方案

大數據實戰練習一

1. Hadoop平臺搭建、部署與應用實踐,包含HDFS分布式文件系統,YARN資源管理軟件,MapReduce計算框架軟件

2. HDFS shell命令操作

3. MapReduce程序在YARN上運行

第二天

上午

Hadoop框架與生態發展,以及應用實踐操作

1. Hadoop的發展歷程

2. Hadoop 1.0的核心組件JobTracker,TaskTracker,以及適用范圍

3. Hadoop 2.0的核心組件YARN工作原理,以及與Hadoop 1.0的聯系與區別

4. Hadoop YARN的資源管理與作業調度機制

5. Hadoop 常用性能優化技術

大數據計算模型(二)——實時處理/內存計算 Spark

1. MapReduce計算模型的瓶頸

2. Spark產生動機、基本概念與適用場景

3. Spark編程模型與RDD彈性分布式數據集的工作原理與機制

4. Spark實時處理平臺運行架構與核心組件

5. Spark寬、窄依賴關系與DAG圖分析

6. Spark容錯機制

7. Spark作業調度機制

8. Spark standardalone,Spark on YARN運行模式

9. Scala開發介紹與Spark常用Transformation函數介紹

第二天

下午

大數據倉庫查詢技術Hive、SparkSQL、Impala,以及應用實踐

1. 基于MapReduce的大型分布式數據倉庫Hive基礎知識與應用場景

2. Hive數據倉庫的平臺架構與核心技術剖析

3. Hive metastore的工作機制與應用

4. Hive 分區、分桶機制,Hive行、列存儲格式

5. 基于Spark的大型分布式數據倉庫SparkSQL基礎知識與應用場景

6. Spark SQL實時數據倉庫的實現原理與工作機制

7. SparkSQL程序開發與DataFrame機制介紹

8. 基于MPP的大型分布式數據倉庫Impala基礎知識與應用場景

9. Impala實時查詢系統平臺架構、關鍵技術介紹,以及與Hive,SparkSQL的對比

Hadoop集群運維監控工具

1. Hadoop運維管理監控系統Ambari工具介紹

2. 第三方運維系統與工具Ganglia, Nagios

大數據實戰練習二

1.基于 Hadoop平臺搭建、部署與配置Spark集群,Spark shell環境實踐,Spark案例程序分析,Spark程序開發與運行

2. 基于MapReduce的Hive數據倉庫實踐,Hive集群安裝部署,基于文件的Hive數據倉庫表導入導出與分區操作,Hive SQL操作,Hive客戶端操作

3. 基于Hive的SparkSQL shell實踐操作

第三天

上午

大數據計算模型(三)——流處理Storm, SparkStreaming

1. 流數據處理應用場景與流數據處理的特點

2. 流數據處理工具Storm的平臺架構與集群工作原理

3. Storm關鍵技術與并發機制

4. Storm編程模型與基本開發模式

5. Storm數據流分組

6. Storm可靠性保證與Acker機制

7. Storm應用案例分析

8. 流數據處理工具Spark Streaming基本概念與數據模型

9. SparkStreaming工作機制

10. SparkStreaming程序開發介紹

11. Storm與SparkStreaming的對比

第三天

下午

大數據ETL操作工具,與大數據分布式采集系統

1. Hadoop與DBMS之間數據交互工具的應用

2. Sqoop導入導出數據的工作原理

3. Flume-NG數據采集系統的數據流模型與系統架構

4. Kafka分布式消息訂閱系統的應用介紹與平臺架構,及其使用模式

面向OLTP型應用的NoSQL數據庫及應用實踐

1. 關系型數據庫瓶頸,以及NoSQL數據庫的發展,概念,分類,及其在半結構化和非結構化數據場景下的適用范圍

2. 列存儲NoSQL數據庫HBase簡介與數據模型剖析

3. HBase分布式集群系統架構與讀寫機制,ZooKeeper分布式協調服務系統的工作原理與應用

4. HBase表設計模式與primary key設計規范

5. 文檔NoSQL數據庫MongoDB簡介與數據模型剖析

6. MongoDB集群模式、讀寫機制與常用API操作

8.鍵值型NoSQL數據庫Redis簡介與數據模型剖析

9.Redis多實例集群架構與關鍵技術

10.NewSQL數據庫技術簡介及其適用場景

大數據實戰練習三

1.Sqoop安裝、部署與配置,基于Sqoop、MySQL與Hive操作MySQL數據庫與Hive數據倉庫數據導入導出

2.Kafka安裝、部署與配置,基于Kafka創建和消費topic實踐操作

3.Flume+HDFS+MapReduce/Spark大數據采集、存儲與分析實踐操作

大數據項目選型、實施、優化等問題交流討論

大數據項目的需求分析、應用實施、系統優化,以及解決方案等咨詢與交流討論

第四天

學習考核與業內經驗交流

授課專家:

蔣老師 清華大學博士,云計算專家 熟悉主流的云計算平臺,并有商業與開源云計算平臺的實踐經驗,對云計算關鍵技術有深刻了解和實踐經驗,如分布式系統、虛擬化、分布式文件系統、云存儲等,參與并領導多個大型云計算項目。對大數據關鍵技術有深刻了解和實踐經驗,如NoSQL數據庫、大數據處理、Hadoop、Hive、HBase、Spark等。

趙老師 清華大學計算機雙學士,甲骨文(中國)軟件系統有限公司高級技術顧問,大數據、數據庫、中間件技術和Java專家。15年IT行業從業經歷,10年培訓授課經驗。具有豐富的大數據方法論、數據科學、大數據生態圈技術知識和大數據規劃建設、應用實施和客戶培訓經驗。

【報名咨詢】

聯系電話:010-62258232  62278113  13718601312  18610339408

聯 系 人:李先生  陳小姐

電子郵件:25198734@qq.com  11075627@qq.com

在線登記培訓意向(提前報名可享受折扣優惠):
課程名稱:
 
企業名稱:*
 
聯系人:*
 
聯系電話:*
 
學員姓名:
 
聯系電話:
 
學員姓名:
 
聯系電話:
 
學員姓名:
 
聯系電話:
 
  (學員信息按報名人數填寫即可,三人以上報名請點擊下載培訓報名表
備 注——
1、收到貴公司報名信息后,我們將第一時間和貴公司參會聯系人確認培訓事宜。
2、開課前兩周,我們將為您發送《培訓確認函》,將培訓地點交通路線及酒店預訂、培訓報到指引等事項告知與您。
3、本課程也可以安排培訓講師到貴公司進行企業內訓,歡迎來電咨詢及預訂講師排期。
4、聯系咨詢電話:010-62278113  13718601312;聯系人:李先生;郵件:25198734@qq.com。
企業培訓導航
·按培訓課題:
企業戰略
運營管理
生產管理
研發管理
營銷銷售
人力資源
財務管理
職業發展
高層研修
標桿學習
認證培訓
專業技能
·按培訓時間:
一月課程
二月課程
三月課程
四月課程
五月課程
六月課程
七月課程
八月課程
九月課程
十月課程
十一月課
十二月課
·按培訓地點:
北京培訓
上海培訓
廣州培訓
深圳培訓
蘇州培訓
杭州培訓
成都培訓
青島培訓
廈門培訓
東莞培訓
武漢培訓
長沙培訓
最新培訓課程
年度培訓計劃
企業培訓年卡
精品研修項目
最新信息 | 培訓需求 | 網站動態 | 網站地圖 | 關于我們 | 聯系我們
企業培訓網致力于為客戶提供優質培訓服務!推動企業進步,助力企業騰飛!
客服電話:010-62258232  QQ:25198734  網站備案:京ICP備06027146號
QQ在線咨詢
掃描添加微信咨詢
在線登記報名