
|
課程培訓
|
中國海關大數據培訓,hadoop培訓
大數據培訓日程 課程目標: 通過該課程的學習,會對大數據離線計算、實時計算的企業級構架有清晰的理解以及對常用的成熟的大數據開源項目從原理到使用有深入的理解。 實時計算的項目常用組合為Flume(數據采集) + Kafka(高可用高并發分布式消息隊列) + spark streaming(流式計算) + hbase(分布式列式存儲數據庫,億級行百萬列毫秒級查詢) 離線計算項目常用組合為分布式文件存儲HDFS,資源調度器、分布式計算框架MapReduce、數據倉庫Hive。 課程大綱: 時間 主題 內容 第一天 上午 離線計算: Hadoop大數據生態圈、分布式存儲HDFS、資源管理 大數據生態圈介紹 開源相關項目說明以及每個項目的用途 實時計算整體構架詳解 離線計算整體構架詳解 分布式文件系統HDFS是什么 HDFS的體系結構 HDFS高可用集群原理詳解 HDFS如何使用 資源管理器介紹以及構架 資源管理器核心組件詳解 資源調度器詳解 下午 離線計算: Hadoop MapReduce&Hive 分布式計算MapReduce介紹 MapReduce整體流程 MapReduce實例 數據倉庫工具Hive介紹 Hive模型介紹:數據庫、表、分區、高級函數 Hive元數據介紹 第二天 上午 實時計算: 數據采集Flume、分布式消息隊列Kafka 實時計算整體構架設計 Flume是什么以及體系結構介紹 Flume組件介紹:agent、source、channel、sink Flume高可用拓撲介紹 Kafka體系結構詳解 Kafka核心概念 Kafka高可用高并發原理 Kafka生產者消費者 Flume寫入kafka 下午 實時計算: spark streaming流式計算、HBase分布式列存儲 spark是什么以及體系結構 彈性分布式數據集RDD spark streaming流式計算體系結構 spark steaming讀取kafka spark算子詳解 HBase存儲數據庫體系結構 Hbase的高可用 HBase數據模型詳解 HBase毫秒級查詢 如果您想學習本課程,請預約報名
如果沒找到合適的課程或有特殊培訓需求,請訂制培訓 除培訓外,同時提供相關技術咨詢與技術支持服務,有需求請發需求表到郵箱soft@w908.cn,或致電4007991916 技術服務需求表點擊在線申請 服務特點: 海量專家資源,精準匹配相關行業,相關項目專家,針對實際需求,顧問式咨詢,互動式授課,案例教學,小班授課,實際項目演示,快捷高效,省時省力省錢。 專家力量: 中國科學院軟件研究所,計算研究所高級研究人員 oracle,微軟,vmware,MSC,Ansys,candence,Altium,達索等大型公司高級工程師,項目經理,技術支持專家 中科信軟培訓中心,資深專家或講師 大多名牌大學,碩士以上學歷,相關技術專業,理論素養豐富 多年實際項目經歷,大型項目實戰案例,熱情,樂于技術分享 針對客戶實際需求,案例教學,互動式溝通,學有所獲 |
|