漫談高可用性與災難重建的規劃與評估

屠立剛 Joseph Tu

  • 精誠資訊/恆逸教育訓練中心-資深講師
  • 技術分類:網路管理與通訊應用

 

 

前言

由於目前網際網路的技術進入到虛擬化與雲端化的系統概念,在這些概念中,都有需要這項非常重要的「高可用性與災難重建」評估的課題,而這項課題就算是在傳統的資訊系統上,也還是非常重要的。

對於現今開始非常依賴資訊系統的人類社群來說,維持資訊系統的正常運作,就變成一件非常重要的事,因此,對於如何維護資訊系統正常運作的概念與規劃也需要更詳細的了解與認識。

基於這項理由,我們就來談一下應如何進行高可用性的評估或規劃,希望這篇文章可以對想要進行撰寫高可用系統評估計畫的人能夠有所幫助。

此題目所牽涉到的概念雖然不多但也不少,怕無法在這次發佈的文章中一次談完,所以我先列出這個主題會談到的內容大綱:

  • 了解Availability與 Reliability的差異?
  • 什麼是 RPO 與 RTO?
  • 如何規劃 RTO 的程序?
  • MTD 與RTO 的關鍵差異?
  • 什麼是 WRT?
  • 什麼是「高可用性/High Availability」?
  • 什麼是「持續運作/Continuous Availability」?
  • 什麼是 MTTF 與 MTBF?
  • 如何規劃 MTBF 的程序?
  • 如何規劃MTTF 的程序?

什麼人要了解此項評估計畫程序

我相信學習過IT相關課程的人,多多少少都會學習到系統是要如何進行資料的備份與還原的,備份系統的目的就在一旦災難發生後,可以將備份系統還原恢復到原來的環境後,便可以繼續運作,通常也只講到這裡。

我在這裡要說的是,以上講的這樣作業是「說的比唱的好聽」。那在什麼樣的情況下可以使用這個「說的會比唱得好聽」呢?那就是,當你的老闆,對於恢復原來運作程度的資訊環境不是這麼嚴苛或重要的時候,這項一般的備份/回復作業是成立的,此時,說的就可以比唱得好聽,也就是說,你可以不必看下去了。

如果你還在猶豫要不要看下去,如何評估「可以繼續唱下去」,最簡單的方式就是你可以先去問一下你的老闆,問老闆:「如果有一天你的電子郵件信箱的信件都不見了,你會怎樣?」如果老闆回你:「無所謂阿!還好吧!」,那你就用說說的方案就可以了。但如果老闆回你:「開玩笑!幾百萬的訂單在裡面!你要給我馬上恢復回來!」你就可以偷笑的用「唱」的方法告訴老闆如何才可以達到老闆的願望,那此時你就要往下看下去囉!


耐吉跑鞋與雲豹跑鞋

耐吉(Nike)跑鞋不用我說,是全球知名品牌的跑鞋,廣受年輕人喜愛,但價格也是不菲,雲豹(ZEPRO)跑鞋是台灣品牌的跑鞋,品質也相當不錯,但價格則比耐吉跑鞋就便宜許多了。

疑!是不是離題了呢?並沒有,延續剛才的故事,當你的老闆非常重視系統運作的能力時,你要如何來告訴你的老闆,應該建立什麼樣的備援系統以及應該要建立什麼樣的災難重建的機制。

你要如何來了解你老闆的喜好與決定傾向呢?這個例子可以幫助你。這就好像你帶你的老闆要去買一雙跑鞋,那你要帶他去買一雙耐吉跑鞋還是雲豹跑鞋呢?而你的老闆會選擇買一雙耐吉跑鞋還是雲豹跑鞋呢?

這項抉擇是很容易造成人的雙重人格的,為什麼?因為耐吉跑鞋與雲豹跑鞋各有各的優點與缺點,有時是很難抉擇的,當然或許也有人可能會更大器的直接選擇「我都買」,哈哈哈!

別小看這個買鞋抉擇,為了這個抉擇可會產生出許多的網紅、許多的開箱文、許多的專家、許多的投機者、許多的...。

我們先來分析一下個別對於選擇耐吉跑鞋的理由與雲豹跑鞋的理由。 我想通常選擇耐吉跑鞋的理由,大多應該是因為耐吉跑鞋耐穿,買一雙可以穿很久,所以貴一點是應該的。選擇雲豹跑鞋的理由可能是因為比較便宜、品質也不比耐吉跑鞋的差,甚至買一雙耐吉跑鞋可以買到兩雙甚至三雙的雲豹跑鞋。


「可用性/Availability」與「可靠性/Reliability」

在學習許多有關 IT 資訊系統時,我相信常會碰到Availability與Reliability這兩個字,但我相信也很多人對這兩個字所陳述的觀念也是比較模糊的。

以上這兩個字的初步概念,通常是在要進行對產品或系統的使用評估時,經常會依據對產品的「可用性/Availability」與「可靠性/Reliability」來進行評估。「可用性」與「可靠性」的概念在綜觀的視野下看起來是非常接近的,但如果要進行差異性的分析,這兩個所代表的評估目標則是不相同的。

繼續以耐吉跑鞋與雲豹跑鞋為例,你會購買耐吉跑鞋與雲豹跑鞋的初步,都應該是因為這兩種跑鞋對你來說,都是具有「可用性」的。但是,當你要進一步的決定要買耐吉跑鞋還是雲豹跑鞋時,如果你選擇耐吉跑鞋的理由是因為耐吉跑鞋可以穿得比較久,那就代表了你加強了「可靠性」的信賴度,相反的,如果你選擇雲豹跑鞋的理由是因為買一雙耐吉跑鞋可以買兩雙雲豹跑鞋,所以如果一雙耐吉跑鞋可以穿兩年,那在兩年之內你可以穿兩雙雲豹跑鞋,這樣的選擇那就代表了你加強了「可用性」的信賴度。

從以上的例子,你有更清楚的了解「可用性」與「可靠性」的差別了嗎? 如果我們評估的焦點是在「產品/系統」可以使用的時間上,「可用性」評估的重點會是在對「產品/系統」的一次可用性與該「產品/系統」的「可取代/可替換性」上,而「可靠性」評估的重點則會是在「不可取代」的條件下,能夠持續使用的能力上。


結論

從以上所說明的概念中,可了解在評估「產品/系統」的使用能力時,首先一開始的評估應該是對該「產品/系統」的可替代性評估,因為如果該「產品/系統」的可替代性很高的話,那相對的就說明了該「產品/系統」的價格與持續維護該「產品/系統」的成本上會比較低。

因此在考量購買該「產品/系統」的決策上,會有以下幾個重點:

  • 該「產品/系統」的一次可執行的能力
  • 該「產品/系統」可取代「備品」的能力
  • 該「產品/系統」在取代替換時間的能力

當評估該「產品/系統」的不可取代性很高的時候,就表示必須要能夠讓該 「產品/系統」能夠執行的更久,因此你就必須再進一步的去評估要如何讓該「產品/系統」可以執行得更久,因此在考量購買該「產品/系統」的決策上,會有以下幾個重點:

  • 該「產品/系統」可以持續執行的最大可能性
  • 該「產品/系統」是要如何的進行維護及保養以及所花費的成本
  • 該「產品/系統」的這個維護及保養要多久做一次
  • 該「產品/系統」如果真的要被取代時,會產生的影響有多大

以上的評估則是歸類在「可靠性」的評估上。

待續...


您可在下列課程中了解更多技巧喔!