危機(jī)四伏的IT叢林 

  “養(yǎng)兵千日,用在一時,但在最關(guān)鍵的時刻,你們卻掉鏈子了”,面對CEO的嚴(yán)厲批評?!癈IO最痛苦的事情是什么?”我用心思考著這個問題。公司與員工在面臨IT危機(jī)時都經(jīng)受了一場最大的考驗(yàn)。隨之而來的是,IT危機(jī)管理成為這段時間使用最頻繁的一個詞。也是讓我作為CIO聽到最頭痛的一個詞。

  隨著技術(shù)的發(fā)展,企業(yè)運(yùn)營越來越依賴于IT系統(tǒng)的穩(wěn)定運(yùn)行。對于CIO來說,保障IT系統(tǒng)正常運(yùn)行非常重要。IT危機(jī)有各種各樣,可分為兩大類:一是企業(yè)外部引起的危機(jī),可能是天災(zāi)也可能是人禍。比如臺灣地震和南亞海嘯影響網(wǎng)絡(luò)通信,暴雨臺風(fēng)或911事件等等;二是企業(yè)內(nèi)部因素所引起的危機(jī),如系統(tǒng)崩潰、系統(tǒng)災(zāi)難,或最簡單的掉電使數(shù)據(jù)備份失敗,還有頻繁的病毒和木馬的攻擊等。

  IT危機(jī)癥狀分析

  IT危機(jī)是指使企業(yè)在IT方面遭受嚴(yán)重?fù)p失或面臨嚴(yán)重?fù)p失威脅的突發(fā)事件。這種突發(fā)事件在很短時間內(nèi)波及很廣層面,對公司正常運(yùn)作產(chǎn)生嚴(yán)重影響。因此,我們是應(yīng)該在IT危機(jī)發(fā)生之后才想到IT危機(jī)管理,還是應(yīng)時刻提防IT危機(jī)的發(fā)生、并建立IT危機(jī)管理體系呢?要回答這個問題,應(yīng)該先回答這樣一個問題:如何理解IT危機(jī)?

  IT危機(jī)在一般情況下都具有三個特點(diǎn):(1)突發(fā)性。IT危機(jī)往往都是不期而至,令人措手不及,例如木馬病毒的攻擊。(2)威脅性。IT危機(jī)的出現(xiàn)往往威脅到公司業(yè)務(wù)運(yùn)作,甚至危及企業(yè)的生存與發(fā)展,例如造成關(guān)鍵數(shù)據(jù)掉失和損壞。(3)緊迫性。當(dāng)IT危機(jī)出現(xiàn)時,對危機(jī)做出的反應(yīng)和處理的時間十分緊迫,任何延遲都會帶來更大的損失,一點(diǎn)點(diǎn)的失誤都會釀成軒然大波。

  因此,面對IT危機(jī),切不可有僥幸的鴕鳥心理一樣,把頭埋在沙土里,那樣即使回避了一時的問題,卻可能為更大的IT危害播下了種子。像鴕鳥一樣的逃避態(tài)度,隨便把頭埋在沙里,殊不知自己大大的屁股正露在外面。

  IT危機(jī)預(yù)警系統(tǒng)的建立

  風(fēng)云變化萬千,只有未雨綢繆的人才能坦然應(yīng)對IT危機(jī)。IT危機(jī)總是突然的、出人意料地爆發(fā),這是CIO必須面對的一個重要考驗(yàn)。而IT危機(jī)管理的最好辦法就是準(zhǔn)確預(yù)見,這是成本最低、最簡便的方法。最基本的做法是建立起IT危機(jī)管理計(jì)劃, 即Crisis Management Plan(CMP),它包括明確定義IT危機(jī)管理人員的角色、職責(zé)和權(quán)限,識別IT危機(jī)類型和反應(yīng)對策程序,以及確認(rèn)所需的資源。另外,還需要事先制定各級計(jì)劃,比如IT緊急反應(yīng)計(jì)劃、業(yè)務(wù)持續(xù)計(jì)劃、IT災(zāi)難恢復(fù)計(jì)劃等。

  首先,必須建立IT危機(jī)預(yù)警系統(tǒng)。

  IT危機(jī)是不可避免的,所以必須為危機(jī)做好準(zhǔn)備。要想在危機(jī)來臨時做到不被動,光有危機(jī)意識是不夠的,必須未雨綢繆,建立IT危機(jī)預(yù)警系統(tǒng)。及時捕捉企業(yè)危機(jī)征兆,為各種危機(jī)提供切實(shí)可行的應(yīng)對措施。

  要預(yù)防IT危機(jī),首先要將所有可能的突發(fā)IT危機(jī)事件一一列舉出來,考慮其可能發(fā)生的后果,并且估計(jì)預(yù)防所需的花費(fèi)。這樣做可能很費(fèi)事,但卻很必要。我們強(qiáng)調(diào)不能只是坐以待斃,應(yīng)該在危機(jī)發(fā)生之前,做好相關(guān)的準(zhǔn)備工作,才能從容不迫的應(yīng)變。因此,對企業(yè)來說,必須列出一張IT危機(jī)評估表,詳列出可能發(fā)生的危機(jī),并且評估它們的等級,依發(fā)生的可能性從最可能到不太可能依序排列。例如針對IT災(zāi)難備份,CIO應(yīng)該根據(jù)業(yè)務(wù)實(shí)際需要制定好詳細(xì)的災(zāi)備計(jì)劃,備份時間間隔、備份類型,本地備份還是異地備份等。

  因此,當(dāng)各種突發(fā)IT危機(jī)發(fā)生時,明確應(yīng)該采取什么樣的對策,通過什么樣的程序進(jìn)行有效處理,確定什么人員在什么時間做什么事,這是危機(jī)預(yù)警系統(tǒng)建立的關(guān)鍵。主要包括以下三個方面:

  (1)組建IT危機(jī)管理小組

  建立IT危機(jī)預(yù)警系統(tǒng)的一項(xiàng)重要工作是成立IT危機(jī)小組。只有做好組織上的準(zhǔn)備,有備而無患,才能更好的應(yīng)對IT危機(jī)的爆發(fā)。小組的主要作用在于全面清晰的對企業(yè)可能面對的各種危機(jī)進(jìn)行預(yù)測,為處理危機(jī)制定有關(guān)的策略和步驟。對管理組員進(jìn)行IT危機(jī)培訓(xùn),在遇到危機(jī)時,能夠全面、快速的處理危機(jī)。

  (2)確定IT危機(jī)級別

  不同的IT危機(jī)狀態(tài),有不同的處理方法。沒有事先確定IT危機(jī)級別列表,會給危機(jī)處理帶來很大的混亂和不便。企業(yè)必須先定危機(jī)級別,并制定相應(yīng)的危機(jī)處理方法,只有這樣,才能在危機(jī)來臨時,做到“兵來將擋,水來土淹”。例如在可能遇到的各類危機(jī)可分為三級:一般事件,緊急事件和重大事件,并形成IT危機(jī)級別詳細(xì)列表說明。

  (3)確立IT危機(jī)處理程序和實(shí)施細(xì)則

  只有制定IT危機(jī)管理制度、流程、策略和IT災(zāi)難恢復(fù)計(jì)劃,才能確保在危機(jī)洶涌而來時能夠理智冷靜,胸有成竹。這些流程在業(yè)務(wù)正常時不起作用,但是IT危機(jī)發(fā)生時會及時啟動并有效運(yùn)轉(zhuǎn),對危機(jī)的處理發(fā)揮重要作用。這樣一旦危機(jī)出現(xiàn),各部門、員工知道做什么,而不必依靠某一個關(guān)鍵人物的急中生智力挽狂瀾。在IT危機(jī)發(fā)生時,要處理的工作何其繁雜,而這一切都需要在極短時間內(nèi)完成。如果事前沒有周全的計(jì)劃、能夠立即付諸實(shí)施的制度和流程、能夠立即投入角色并展開工作的人員,則可以預(yù)見在IT危機(jī)發(fā)生時反應(yīng)遲緩、內(nèi)外混亂將無法避免。

  其次,應(yīng)該進(jìn)行IT危機(jī)模擬預(yù)演。

  應(yīng)根據(jù)IT危機(jī)應(yīng)變計(jì)劃進(jìn)行定期的摸擬預(yù)演。IT危機(jī)演習(xí)是為了評估危機(jī)預(yù)警系統(tǒng)能否有效地實(shí)施。定期的模擬訓(xùn)練不僅可以提高IT危機(jī)小組的快速反應(yīng)能力,強(qiáng)化危機(jī)管理意識,還可以檢測已擬定的危機(jī)應(yīng)變計(jì)劃是否充實(shí)、可行,找出IT危機(jī)預(yù)警準(zhǔn)備中的不足,可以及時改善。

  制定好IT危機(jī)計(jì)劃后,并不是萬事大吉,束之高閣,不經(jīng)過演練的計(jì)劃無異于紙上談兵。很多企業(yè)沒有意識到這一點(diǎn),企業(yè)往往花費(fèi)了大量的人力和物力制定了IT危機(jī)預(yù)警系統(tǒng),以為萬事大吉了。殊不知,在IT危機(jī)狀態(tài)下這些措施并不一定有效。

  處理IT危機(jī)的方法

  雖然IT危機(jī)管理的重點(diǎn)是預(yù)防危機(jī),預(yù)防危機(jī)的措施也可以做得相當(dāng)周密。但是IT危機(jī)誘因復(fù)雜多變,危機(jī)仍是防不勝防。因此,IT危機(jī)管理的另一項(xiàng)職能就是處理已經(jīng)發(fā)生的危機(jī),把危機(jī)損失和影響減少到最低程度。

  危機(jī)爆發(fā)時的破壞力最大,因此本階段的危機(jī)管理也最重要。第一步要做的就是遏制危機(jī),這要求危機(jī)處理在最短的時間內(nèi)掌握并控制危機(jī)形勢,將損失降至最低。第二步要做的是防止危機(jī)的蔓延,把危機(jī)限定在一定的范圍之內(nèi)。在日常活動中,IT危機(jī)就像感冒病毒一樣,種類繁多防不勝肪。那么如何進(jìn)行危機(jī)管理呢?

  (1)在危機(jī)處理時,要立即調(diào)查情況、以控制事態(tài)的發(fā)展,啟動危機(jī)處理小組對IT危機(jī)的狀況做一個全面的分析:危機(jī)產(chǎn)生的原因是什么,內(nèi)因還是外因?危機(jī)發(fā)展的狀況及趨勢如何?這些問題必須弄清楚,因?yàn)檫@將是采取補(bǔ)救措施的直接依據(jù)。在這個階段,速度是關(guān)鍵,危機(jī)不等人。在IT危機(jī)發(fā)生后最短的時間內(nèi)做出反應(yīng)采取相應(yīng)措施,根據(jù)不同情況確定工作的優(yōu)先次序,把損失變?yōu)樽钚 ?/p>

  (2)一旦找出IT危機(jī)產(chǎn)生的原因,必須立刻制定相應(yīng)的危機(jī)計(jì)劃和對策。危機(jī)管理計(jì)劃必須是具體的、可以操作的,不應(yīng)該有任何含糊之辭。危機(jī)管理計(jì)劃應(yīng)明確所涉及部門及人員的權(quán)利和責(zé)任,對人員進(jìn)行有效配置,做到事事有人管,從而在危機(jī)來臨時都能夠迅速找到自已的位置。如果危機(jī)管理計(jì)劃混亂,雜亂無章,相關(guān)人員就會反應(yīng)遲鈍、迷茫無助或混亂不堪。

  (3)應(yīng)有輕重緩急,主次優(yōu)劣的區(qū)分。首先對IT危機(jī)管理的目標(biāo)應(yīng)有優(yōu)先序列,其次對一系列多種同時發(fā)生的危機(jī)也應(yīng)先應(yīng)先急后緩,先重后輕。

  (4)必須有IT危機(jī)管理的預(yù)算。IT危機(jī)處理必須根據(jù)自身的人力、物力、財力資源為基礎(chǔ),而不能以IT危機(jī)事件的種類為依據(jù),否則危機(jī)處理只會成為水中月,鏡中花,沒有任何現(xiàn)實(shí)意義。

  檢驗(yàn)危機(jī)管理是否有效的步驟

  危機(jī)是一種潛在的危險,危機(jī)管理正如在“刀尖上的舞蹈”一樣。危機(jī)管理絕不是危機(jī)出現(xiàn)以后才開始管理,而是要在危機(jī)發(fā)生之前采取措施,做到未雨綢繆。否則危機(jī)處理不好就會產(chǎn)生惡劣的后果。作為CIO,就要時時檢驗(yàn)和測試公司的危機(jī)管理是否有效。

  這里提供檢驗(yàn)危機(jī)管理是否有效的兩個步驟:

  第一,如果在非辦公時間出現(xiàn)危機(jī),公司有什么樣的內(nèi)部溝通系統(tǒng)?例如星期天遇到危機(jī),需要多長時間消息傳達(dá)到每一位相關(guān)責(zé)任人?

  危機(jī)處理小組的成立也是必要的準(zhǔn)備工作,這些成員必須提供二十四小時的聯(lián)絡(luò)方式,例如電話以及e-mail,當(dāng)危機(jī)發(fā)生時,自然而然形成一個通訊網(wǎng) ,每個人都適時扮演適當(dāng)?shù)慕巧_@個危機(jī)處理小組必須在危機(jī)發(fā)生前就成立,因?yàn)楫?dāng)危機(jī)發(fā)生時 ,每個人都手忙腳亂、毫無頭緒,屆時再成立已經(jīng)太晚。

  第二,針對IT危機(jī)類型,公司有什么樣的應(yīng)急反應(yīng)計(jì)劃?這項(xiàng)計(jì)劃最后一次更新是什么時候?以前有沒有預(yù)演過以確認(rèn)它是否有效?它與公司其他的反應(yīng)計(jì)劃能否匹配?

  典型的危機(jī)管理處理都會有一個時間表。例如當(dāng)危機(jī)發(fā)生時,應(yīng)該做些什么,找出真正的實(shí)情為何,決定何時要響應(yīng)危機(jī)。依照危機(jī)的狀況不同,蔓延的情況也會有所差異。有些可能十二小時內(nèi)可以解決,有些則需要花上幾天到數(shù)個禮拜的時間。一般來說,危機(jī)發(fā)生的頭幾天,通常是比較緊張的時候,企業(yè)必須和時間賽跑,分秒必爭。

  測試危機(jī)管理的常用方法

  過去,我們在處理正常事故時通常也會形成一些危機(jī)管理的準(zhǔn)則和措施,但這些原則已經(jīng)不能滿足今天的需要。我們現(xiàn)在需要培養(yǎng)對正常以及非正常事故進(jìn)行綜合思考的能力,這里提供幾種常用的測試方法。

  (1)危機(jī)轉(zhuǎn)盤

  預(yù)防非正常事故的方法有好多種,其中隨機(jī)地思考這類事故就是一個好的方法,隨機(jī)思考的工具之一就是危機(jī)轉(zhuǎn)盤。危機(jī)轉(zhuǎn)盤是像小孩子游戲中用到的那種帶箭頭的轉(zhuǎn)盤,在轉(zhuǎn)盤上列出公司可能面臨的所有危機(jī)的種類。這個方法很有效,因?yàn)镃IO都習(xí)慣做常見的危機(jī)規(guī)劃,而精心策劃的隨機(jī)選擇方法可以轉(zhuǎn)移他們的參照點(diǎn),逼迫CIO跳出自己的思維定勢。

 ?、儆蒊T團(tuán)隊(duì)成員輪流轉(zhuǎn)動轉(zhuǎn)盤。轉(zhuǎn)盤停止時,根據(jù)箭頭所指的IT危機(jī)種類,討論大家能想到的所有正常的和非正常的危機(jī)。任何一種可能性都不能排除,不管這種想法看上去是多么可笑,因?yàn)槊恳环N想法都可能顛覆CIO對自己已知情況的根本觀念,改變大家對公司可能面對哪些危機(jī)的想法。

 ?、谌缓?,把兩個或兩個以上的非正常危機(jī)組合在一起。當(dāng)然,這種情況在現(xiàn)實(shí)中發(fā)生的可能性就更小了。但是一旦發(fā)生,危險系數(shù)就更大。這迫使大家接受這樣的事實(shí),即:非正常災(zāi)難經(jīng)常是大規(guī)模發(fā)生的。這也幫助CIO聯(lián)想起一些新的危機(jī),這些危機(jī)大家以前從未想到可能會發(fā)生在自己的公司或行業(yè)中。

  (2)扮演內(nèi)鬼

  進(jìn)行危機(jī)預(yù)防工作時,許多公司依賴自己的員工來研究應(yīng)該預(yù)防的危機(jī),因?yàn)閱T工最了解公司的情況。然而,由于員工非常了解公司的情況,考慮就會常常受限于習(xí)慣。因此大家并不能有效的從反面思考問題,或者說像壞人那樣思考。一些特殊的方法能幫助CIO做到這一點(diǎn),角色扮演就是其中之一。

  在進(jìn)行訓(xùn)練時,CIO和IT成員組成測試小組,把自己想象成“內(nèi)鬼”或恐怖分子。這樣,大家就能暫時拋開習(xí)慣的理性思考方式和道德標(biāo)準(zhǔn),利用自己對公司產(chǎn)品、流程和制度的熟悉,想出從內(nèi)部或外部破壞公司的方法。當(dāng)大家采用“恐怖分子”的視角時,往往上爬能指出哪些地方能制造最大的破壞,和如何制造這樣的破壞。這種方法經(jīng)常可以改變公司對IT危機(jī)的態(tài)度。

  (3)間諜游戲

  還有一種更極端的測試方法,例如大膽地邀請外人測試公司對危機(jī)處理的脆弱性。我們認(rèn)為員工太了解公司,或者身陷公司的日常運(yùn)營中,因此不能采用完全不同的角度來看問題。創(chuàng)造性地利用無偏見的專家,能幫助公司打破思維慣性,不再用否定的觀點(diǎn)看待危機(jī),認(rèn)為“這不可能在我們公司發(fā)生”。

  這種戲劇性的緊張練習(xí)能幫助CIO接受現(xiàn)實(shí),認(rèn)識到可能某一天也要處理此類危機(jī)。罪犯的心態(tài)與大多數(shù)人完全不同,在很多情況下CIO只有把這種心態(tài)帶入公司,才能真正地弄清楚罪犯會如何思考問題。例如,一些曾經(jīng)是黑客高手的安全顧問發(fā)現(xiàn)公司最容易被黑客侵入的領(lǐng)域,這些問題不是軟件或者系統(tǒng)缺陷造成的,而是員工的無心之過帶來的。此前,大多數(shù)CIO都不會認(rèn)為,這些無心之過也會對網(wǎng)絡(luò)安全帶來威脅。

  古語云:“人無遠(yuǎn)慮,必有近憂”。既然IT危機(jī)不可避免,只有防范危機(jī)未然中,才能扭轉(zhuǎn)IT危機(jī)于旦夕之間。危機(jī)是每個企業(yè)都不愿面對的事,但是在發(fā)生后吸收經(jīng)驗(yàn),一方面可以防止類似事件再發(fā)生,另一方面也可以在處理方式上更加成熟。平時多一些IT危機(jī)意識,多制定幾套對付各種可能出現(xiàn)的IT危機(jī)之策略,危機(jī)來臨時就會鎮(zhèn)定從容得多。

責(zé)任編輯:admin