Cloudera讓Hadoop易用

Facebook、Google 和Yahoo建構大型Hadoop後,希望能簡化Hadoop,讓他們能更快運用大數據資料。 Cloudera以協助企業運用Hadoop為目的,推出Hadoop軟體提供許多簡易方式,讓一般企業能更容易運用Hadoop。 此外,Cloudera也降低Hadoop雲端軟體門檻,讓所有企業都能有運用大量資料處理能力。

Cloudera Hadoop運用

以往舊技術只允許銀行信用卡保存60天的資料,無法辨識詐騙行為從何而來,且技術所需的費用昂貴;如果使用Cloudera的Hadoop平台,可以追溯10年份的資料,讓警方可以輕易追蹤到信用卡詐騙來源。

Cloudera Hadoop最佳解決方案

在資訊爆炸時代,企業想分析這麼大量的資料,舊有技術已無法負荷;若使用舊科技儲存資訊,企業所需成本是每Terabyte五萬美元以上,昂貴又不具彈性。Cloudera的Hadoop平台可以輕鬆的管理、並幫助企業分析這些大量資訊,大幅降低成本。

恆逸教育訓練中心取得台灣唯一Cloudera原廠授權
針對不同的客戶量身訂做課程

程式開發者

Spark與Hadoop開發者訓練課程


透過本課程您將學會:

  • 如何對Hadoop Cluster的資料進行分散式儲存與處理
  • 如何在Hadoop Cluster裡撰寫、設定與部署Spark應用程式
  • 使用Spark Shell進行互動式資料分析
  • 使用Spark SQL對結構化資料進行處理與查詢
  • 使用Spark Streaming處理即時資料流

管理者

CDP私有雲之管理者訓練課程


透過本課程您將學會:

  • 安裝Cloudera Manager
  • 使用Cloudera Manager安裝CDP私有雲叢集
  • 使用Cloudera Manaver組態與監控叢集
  • 了解、評估與選擇最合適的資料儲存選項
  • 最佳化叢集效能
  • 執行日常的叢集維護工作
  • 偵測、解決與修復叢集所出現的問題

資料分析師

Cloudera資料分析師訓練課程


透過本課程您將學會:

  • 如何使用開放原始碼的大資料生態系工具解決傳統RDBMS無法克服的挑戰
  • 使用Apache Hive與Apache Impala提供SQL介面來存取大資料資料集
  • Hive與Impala的語法與資料格式,包含函數與子查詢
  • 使用參數、客製檔案格式、SerDes與外部指令稿來擴增Hive與Impala的功能
  • 進行某項工作前,如何決定該使用Hive、Impala或RDBMS?或者採用混合模式

顧客上課心得


  • 建立Hadoop基本概念建立
  • 了解Hadoop維運需注意之環境參數調整
  • 對CDH管理維運有初步瞭解
  • 了解Hadoop Ecosystem 技術觀念
  • 整體Cloudera Ecosystem認知與前後版本差異
  • hands on practice and detail explain about related topics
  • Spark/Sqoop/Import RMDB from spark jdbc
  • 學到豐富的 Pig Hive Impala 相關知識
  • 整個Hadoop ecosystem介紹完整,且對於各個子部分介紹詳盡,練習的範例也很不賴
  • Spark SQL 比較跟 Database 資料處理有關
  • YARN Resource Management