Cloudera讓Hadoop易用

Facebook、Google 和Yahoo建構大型Hadoop後,希望能簡化Hadoop,讓他們能更快運用大數據資料。 Cloudera以協助企業運用Hadoop為目的,推出Hadoop軟體提供許多簡易方式,讓一般企業能更容易運用Hadoop。 此外,Cloudera也降低Hadoop雲端軟體門檻,讓所有企業都能有運用大量資料處理能力。

Cloudera Hadoop運用

以往舊技術只允許銀行信用卡保存60天的資料,無法辨識詐騙行為從何而來,且技術所需的費用昂貴;如果使用Cloudera的Hadoop平台,可以追溯10年份的資料,讓警方可以輕易追蹤到信用卡詐騙來源。

Cloudera Hadoop最佳解決方案

在資訊爆炸時代,企業想分析這麼大量的資料,舊有技術已無法負荷;若使用舊科技儲存資訊,企業所需成本是每Terabyte五萬美元以上,昂貴又不具彈性。Cloudera的Hadoop平台可以輕鬆的管理、並幫助企業分析這些大量資訊,大幅降低成本。

恆逸教育訓練中心取得台灣唯一Cloudera原廠授權
針對不同的客戶量身訂做課程

程式開發者

Cloudera 資料工程-使用 Apache Spark 開發應用程式


透過本課程您將學會:

  • 了解在CDP Cluster中資料如何分散儲存與分散處理
  • 了解如何撰寫、設定與部署Spark應用程式
  • 使用Spark Shell與Spark應用程式探索、處理與分析分散儲存的資料
  • 使用Spark SQL、DataFrame與Hive Table資料查詢
  • 使用Spark Streaming協同Kafka處理即時資料流

管理者

CDP私有雲之管理者訓練課程


透過本課程您將學會:

  • 安裝Cloudera Manager
  • 使用Cloudera Manager安裝CDP私有雲叢集
  • 使用Cloudera Manaver組態與監控叢集
  • 了解、評估與選擇最合適的資料儲存選項
  • 最佳化叢集效能
  • 執行日常的叢集維護工作
  • 偵測、解決與修復叢集所出現的問題

資料分析師

Cloudera資料分析師訓練課程


透過本課程您將學會:

  • 如何使用開放原始碼的大資料生態系工具解決傳統RDBMS無法克服的挑戰
  • 使用Apache Hive與Apache Impala提供SQL介面來存取大資料資料集
  • Hive與Impala的語法與資料格式,包含函數與子查詢
  • 使用參數、客製檔案格式、SerDes與外部指令稿來擴增Hive與Impala的功能
  • 進行某項工作前,如何決定該使用Hive、Impala或RDBMS?或者採用混合模式

顧客上課心得


  • 對CDH管理維運有初步瞭解
  • 了解Hadoop Ecosystem 技術觀念
  • 整體Cloudera Ecosystem認知與前後版本差異
  • Spark/Sqoop/Import RMDB from spark jdbc
  • 整個Hadoop ecosystem介紹完整,且對於各個子部分介紹詳盡,練習的範例也很不賴
  • Spark SQL 比較跟 Database 資料處理有關
  • YARN Resource Management
  • system architecture & operation
  • 很多課本上的一句話,老師用圖像說明,真的非常有幫助,感謝!
  • 工作內容屬於是撰寫程式,對於程式撰寫的部分會覺得網路上的資源比較多,接觸的多,所以我比較著重於各個Apache專案之間建構的細節,以及Node之間的運作原理,與一些實際案例碰到的細節。 老師能清楚回答出我描述的問題情境與疑惑處,推薦各位上這門課,不管是入門或是已經接觸過的同學,都能有不同的回饋。