Cloudera - CDA

Cloudera資料分析師訓練課程

Cloudera Data Analyst Training
  • 時數:28小時
  • 費用:NT$ 64,000
  • 點數:19.0

選擇查詢分區開課時間

地點 班號 日期 時間 報名
台北 21737 班 2021/11/09 ~ 2021/11/12 每週二三四五 09:00~17:00 報名

目前查無開課時段

詳細開課時間請洽詢業務

聯絡恆逸

教材

Cloudera原廠教材

課程目標

本課程將教您如何使用Apache Hive、Apache Impala,讓您可以在大資料環境裡使用傳統的資料分析與商業智慧技術,同時也會展示資料專家如何使用類SQL語言存取、操作、分析複雜的大資料資料集,而不需要使用Java、Scala、Python等程式開發語言,並透過講師引導式討論、互動與實際操作練習,您將一覽Hadoop生態系的全貌。

適合對象

1.資料分析人員

2.商業分析人員

3.程式開發人員

4.系統管理人員

預備知識

1.SQL語言

2.基本Unix/Linux操作(不需要具備任何Apache Hadoop經驗)

課程內容

  1. Introduction
  2. Apache Hadoop Fundamentals
  3. Introduction to Apache Hive and Impala
  4. Querying with Apache Hive and Impala
  5. Common Operators and Built-in Functions
  6. Data Management
  7. Data Storage and Performance
  8. Working with Multiple Datasets
  9. Analytic Functions and Windowing
  10. Complex Data
  11. Analyzing Text
  12. Apache Hive Optimization
  13. Apache Impala Optimization
  14. Extending Apache Hive and Impala
  15. Choosing the Best Tool for the Job
  16. Conclusion

學會技能

  1. 如何使用開放原始碼的大資料生態系工具解決傳統RDBMS無法克服的挑戰
  2. 使用Apache Hive與Apache Impala提供SQL介面來存取大資料資料集
  3. Hive與Impala的語法與資料格式,包含函數與子查詢
  4. 建立、修改與刪除表格、視圖與資料庫,載入資料與儲存查詢結果
  5. 建立、使用分區與不同的檔案格式
  6. 正確地使用JOIN或UNION組合兩個或多個資料集
  7. 了解分析函數與視窗函數以及如何使用它們
  8. 儲存與查詢複雜或巢套資料結構
  9. 處理與分析半結構化與無結構化資料
  10. 優化Hive與Impala查詢的技巧
  11. 使用參數、客製檔案格式、SerDes與外部指令稿來擴增Hive與Impala的功能
  12. 進行某項工作前,如何決定該使用Hive、Impala或RDBMS?或者採用混合模式

備註事項

1.【遠端監考】

2015/5/1起Cloudera認證將改由Innovative Exams提供認證考試服務,採用遠端監考措施,考生可在任何地方包括家裡自行應考(使用Chrome瀏覽器),考題與認證資格均不變,考生將受web cam、環境影音、鍵盤監控考試狀況。

2.【考試資格購買】

學員可直接到Cloudera網站購買:

CCA Data Analyst Certification:(Exam CCA-159)

https://university.cloudera.com/content/cca159