Python - Pysp

爬蟲與社群聆聽視覺化分析實務課程-使用Python

Social Listening and Analytics with Python and NoSQL
  • 時數:21小時
  • 費用:NT$ 24,000
  • 點數:6.0

選擇查詢分區開課時間

地點 班號 日期 時間 報名
台北 20821 班 2020/03/12 ~ 2020/03/31 每週二四 18:30~22:00 報名
台北 20820 班 2020/04/27 ~ 2020/04/29 每週一二三 09:00~17:00 報名
台北 20822 班 2020/06/06 ~ 2020/06/13 每週六日 09:00~17:00 報名
新竹 20820ZH 班 2020/04/27 ~ 2020/04/29 每週一二三 09:00~17:00 報名 Live
台中 20820ZT 班 2020/04/27 ~ 2020/04/29 每週一二三 09:00~17:00 報名 Live

目前查無開課時段

詳細開課時間請洽詢業務

聯絡恆逸

教材

恆逸專用教材

課程目標

本課程適合已有程式設計基礎(Python)與基礎資料庫結構(MySQL, MongoDB),並且想要學習網路爬蟲(Crawler, Spider)環境部屬,撰寫爬蟲腳本,運用Web Application作為混搭型態的採集程式,課程將以Python Scrapy、Python Selenium做為工具,指導您建立爬蟲基礎功能,搭配視覺化開發工具的HTML5作為呈現結果,打造Social Listening社群聆聽技術能力,而除了涵蓋網頁Crawler之外,進一步踏入手持設備做為分散式Device Crawler節點的實戰經驗,將以Android APP為例動手實作專案。本課程理論觀念與實作並重,不僅只學會語法,更能延展適用任何垂直媒體,進而在數位廣告效益上補足非結構化資料分析的樣貌。

適合對象

已經有Python或其他程式語言基礎或有獨立開發或管理過小型軟體專案者,對於爬蟲初次接觸,或無撰寫過爬蟲經驗者,課程將深入淺出引導關鍵程式,從無到有學習爬蟲腳本、非結構化(NoSQL)資料庫,成為大數據分析社群分析的領先者。

預備知識

  1. 熟悉Windows作業系統

  2. 基本Python或其他程式設計語法基礎,若無程式語言設計基礎,請先選修相關程式語言設計課程。

課程內容

  1. 社群網路- Social Network

  2. 爬蟲技術,採集、清洗、存儲、運算

  3. Python, MongoDB, PHP, Apache環境準備與安裝

  4. Python Scrapy爬蟲實作

  5. PHP爬蟲實作

  6. 社群發文、留言分析

  7. 社群Dashboard-視覺化呈現

  8. 爬蟲應用-輿情分析、即時、非即時

  9. 品牌災難應變-以啤酒代言人專案為例

學會技能

  1. 建構Python爬蟲環境,部署多層爬蟲節點架構
  2. 習得以HTTP GET/POST為基底的底層Request協同作業
  3. 企業打造社群聆聽Social Listening即時資訊的巨量資料處理平台
  4. 獨立開發各媒體爬蟲手法,從PTT、Facebook、蝦皮、Mobile01、新聞媒體完整解析解決方案
  5. 專屬企業外部資料快速蒐集,產出前端Crawler到後端非結構化資料庫的完整框架
  6. 視覺化、量化社群指標,洞察文章的聲量成長趨勢,了解網路生理時鐘脈動
  7. 內化數據分析能力,使用Python視覺化工具Plotly與雲端視覺化工具使用
  8. 站在社群網路的肩膀上,俯瞰企業在行銷策略的社群成效,知曉分析競品社群網路操作手法
  9. 以PHP發佈Dashboard主控台,作為社群觀測站的戰情室
  10. 為企業培養社群生態分析師,實作斷詞斷句與文字雲,邁向自然語言訓練模型做準備