Cloudera - CDA
Cloudera資料分析師訓練課程
Cloudera Data Analyst Training
- 時數:28小時
- 費用:NT$ 64,000
- 點數:19.0
選擇查詢分區開課時間
地點 | 班號 | 日期 | 時間 | 報名 |
---|---|---|---|---|
台北 | 22918 班 | 2022/08/22 ~ 2022/08/25 每週一二三四 | 09:00~17:00 | 報名 |
目前查無開課時段
詳細開課時間請洽詢業務
聯絡恆逸
教材
Cloudera原廠教材
課程目標
本課程將教您如何使用Apache Hive、Apache Impala,讓您可以在大資料環境裡使用傳統的資料分析與商業智慧技術,同時也會展示資料專家如何使用類SQL語言存取、操作、分析複雜的大資料資料集,而不需要使用Java、Scala、Python等程式開發語言,並透過講師引導式討論、互動與實際操作練習,您將一覽Hadoop生態系的全貌。
適合對象
1.資料分析人員
2.商業分析人員
3.程式開發人員
4.系統管理人員
預備知識
1.SQL語言
2.基本Unix/Linux操作(不需要具備任何Apache Hadoop經驗)
課程內容
- Introduction
- Apache Hadoop Fundamentals
- Introduction to Apache Hive and Impala
- Querying with Apache Hive and Impala
- Common Operators and Built-in Functions
- Data Management
- Data Storage and Performance
- Working with Multiple Datasets
- Analytic Functions and Windowing
- Complex Data
- Analyzing Text
- Apache Hive Optimization
- Apache Impala Optimization
- Extending Apache Hive and Impala
- Choosing the Best Tool for the Job
- Conclusion
學會技能
- 如何使用開放原始碼的大資料生態系工具解決傳統RDBMS無法克服的挑戰
- 使用Apache Hive與Apache Impala提供SQL介面來存取大資料資料集
- Hive與Impala的語法與資料格式,包含函數與子查詢
- 建立、修改與刪除表格、視圖與資料庫,載入資料與儲存查詢結果
- 建立、使用分區與不同的檔案格式
- 正確地使用JOIN或UNION組合兩個或多個資料集
- 了解分析函數與視窗函數以及如何使用它們
- 儲存與查詢複雜或巢套資料結構
- 處理與分析半結構化與無結構化資料
- 優化Hive與Impala查詢的技巧
- 使用參數、客製檔案格式、SerDes與外部指令稿來擴增Hive與Impala的功能
- 進行某項工作前,如何決定該使用Hive、Impala或RDBMS?或者採用混合模式
備註事項
相關連結
台北恆逸教育訓練中心
- 02-25149191
- 02-25149292
- 台北市松山區復興北路99號14樓
新竹恆逸教育訓練中心
- 03-5723322
- 03-5745738
- 新竹市光復路二段295號3樓之2
台中恆逸教育訓練中心
- 04-23297722
- 04-23102000
- 台中市西區臺灣大道二段309號2樓
高雄恆逸教育訓練中心
- 07-5361199
- 07-5361698
- 高雄市前鎮區中山二路2號25樓