Amazon Web Services - AWBD
Big Data on AWS
Big Data on AWS
- 時數:21小時
- 費用:NT$ 34,020
- 點數:8.5
教材
課程目標
Big Data on AWS介紹以雲端為基礎的大數據解決方案,例如Amazon Elastic MapReduce(EMR)、Amazon Redshift、Amazon Kinesis及其他AWS大數據平台。在本課程中,我們為您介紹如何使用Amazon EMR以Hive和Hue這類廣泛的Hadoop工具生態系統處理資料。授課內容還包括如何建立大數據環境,使用Amazon DynamoDB、Amazon Redshift 和 Amazon Kinesis,以及利用最佳實務來設計具安全性和成本效益的大數據環境。
適合對象
- 負責設計和實作大數據解決方案的個人,即解決方案架構師和系統操作管理員
- 對了解AWS大數據解決方案感興趣的資料科學家和資料分析師
預備知識
- 熟悉大數據技術的基本知識,包括Apache Hadoop、MapReduce、HDFS和SQL/NoSQL查詢
- 具有核心AWS服務和公有雲端實作工作經驗
- 了解資料倉儲、關聯式資料庫系統和資料庫設計的基本知識
已完成以下課程所具備技術能力
AWTE:AWS Technical Essentials
Big Data Technology Fundamentals Web課程培訓或具備同等經驗
課程內容
- 大數據概觀
- 導入、傳輸和壓縮
- 儲存解決方案
- 在DynamoDB儲存和查詢資料
- 大數據處理和Amazon Kinesis
- Apache Hadoop和Amazon EMR簡介
- 使用Amazon Elastic MapReduce
- Hadoop程式設計框架
- 在Amazon EMR以Hive處理伺服器日誌
- 在Amazon EMR使用Hadoop串流處理化學資料
- 利用Hue簡化Amazon EMR體驗
- 在Amazon EMR上的Hue執行Pig指令碼
- Amazon EMR上的Spark
- 在Amazon EMR上利用Spark和Spark SQL以互動方式建立和查詢表格
- 管理Amazon EMR成本
- 保護Amazon EMR部署的安全
- 資料倉儲和單欄式資料存放區
- Amazon Redshift和大數據
- 優化Amazon Redshift環境
- 大數據設計模式
- 大數據的視覺化及編製
- 使用Tibco Spotfire視覺化大數據
學會技能
將AWS解決方案融入大數據生態系統
在Amazon EMR內容應用Apache Hadoop識別Amazon EMR叢集的元件
啟動和設定Amazon EMR叢集
利用Amazon EMR的常用程式設計框架,包括Hive、Pig和Streaming
利用Hue改善Amazon EMR的易用性
在Amazon EMR上使用記憶體內分析搭配Spark和Spark SQL使用
選擇適當的AWS資料儲存體選項
識別針對幾乎即時的大數據處理使用Amazon Kinesis的好處
定義資料倉儲和單欄式資料庫概念
利用Amazon Redshift有效率地存放和分析資料
了解和管理Amazon EMR與Amazon Redshift部署的費用和安全
識別導入、傳輸和壓縮資料等選項
使用視覺化軟體描述資料和查詢
使用AWS Data Pipeline協調大數據工作流程
備註事項
- 上課時間為09:00~17:00
- 請自行攜帶筆記型電腦(含電源線/滑鼠/無線網卡或外接式網路卡)
- 此課程需向原廠訂購電子教材及實驗環境,請於開課前兩週完成報名並繳清課程費用
此課程可協助您取得下列認證:AWS Certified Data Analytics – Specialty
相關連結
台北恆逸教育訓練中心
- 02-25149191
- 02-25149292
- 台北市松山區復興北路99號14樓
新竹恆逸教育訓練中心
- 03-5723322
- 03-5745738
- 新竹市光復路二段295號3樓之2
台中恆逸教育訓練中心
- 04-23297722
- 04-23102000
- 台中市西區臺灣大道二段309號2樓
高雄恆逸教育訓練中心
- 07-5361199
- 07-5361698
- 高雄市前鎮區中山二路2號25樓