
本案例由南方航空計算機中心朱琳提供,并獲得南方航空計算機中心授權發布。
項目背景
中國南方航空股份有限公司是目前中國最大的航空公司之一,擁有多家分公司,公司目前員工數量32000 多。目前航空業的大部分業務都依賴于一個穩定高效的IT 支持環境,南航的IT 建設在各大航空公司中是最完善和齊全的,擁有十多個個大系統和許多小系統,計算機中心員工達到200 人,擁有多個機房,南航計算機中心數據部負責所有核心服務器的管理。
公司全部的生產經營和日常運作已經和計算機信息系統息息相關,IT 服務的質量已經影響到公司運作的方方面面。
南航目前擁有了大量的業務支撐系統,大大提高了南航的IT 管理水平和提高了效率,但是在目前的手工和半自動化管理現狀下,無法達到確保IT 系統的穩定運行和快速響應;同時,維護經驗和知識積累在個人手中,而沒有形成知識共享,同一個問題會被不同的人員重復研究去解決,浪費了大量的時間;另外,日常維護工作復雜性很高、可變性高,沒有形成標準規范,故障問題有時候因為個人的疏忽而導致沒有后續跟蹤處理。
為了解決這些問題,形成一套完善的管理機制,數據部急需尋找一個基于自身環境和資源下的IT 服務管理系統,運用一套完善的管理體系和支撐系統形成高效的IT 服務集中管理。
項目的目標和范圍
在項目啟動時,通過對ITIL 的研究和理解,也了解實施ITSM 的案例后,確定了以下幾個明確的目標和范圍:
* 改善IT 基礎設施的運維水平,針對內外部客戶提高事故和問題處理的響應速度
* 集中各個單點信息,形成統一的信息庫和知識庫,并可以進行各種統計分析
* 對軟硬件、網絡等資產設備進行的管理,跟蹤企業IT 資產在每個管理周期內的變化
* 可以對企業的各種IT 資源(主機、網絡、應用軟件、基礎軟件等)全面、統一集中管理,確保IT 系統為企業業務發展提供可靠、高效、安全的信息服務
* 和現有網絡管理系統進行集成,自動接收其產生的事故并進行及時處理
* 從公司戰略角度慢慢實現服務級別管理、能力管理等目標
項目實施過程
由于項目建設涉及到多個環節和系統,整個項目主要由杰傲科技和客戶方相關人員進行 主體設計和開發實施工作;翰緯咨詢進行ITSM/ITIL 理論指導和顧問工作;
因為系統和南航現有的 Unicenter 網管產品結合緊密和事件集成,有CA 公司的專業技術人員參與顧問指導。
南方航空原有CA 的系統(CA Unicenter),此次實施和改造并不是完全模仿ITSM 各模塊的形式,而要根據ITIL 思想,結合實際情況,進行重組融合。其中,研究企業本身的業務需求,審視自身的資源配置,調整自身的組織架構和進行流程定義,是系統實施的關鍵部分。
事故管理和服務臺,是見效最快的幾個流程,可以首先實現。其它流程可以根據自身需求,需求的級別,以及企業自身的資源和組織架構狀況,進行取舍;并依據具體的業務習慣,進行定制。
在實施過程中采取以下過程和方法論
* 分析評估:分析當前IT 環境、資源、管理方式的當前狀況,以及管理意識和水平,收集未來對IT 系統和服務水平的要求?? 系統設計:根據當前狀況和未來需求,根據ITIL 理論設計一個成熟的符合未來需求的ITSM 系統,以及與之適應的組織結構
* 系統規劃:根據目前最迫切需求、效果最好的方式,分階段實施的方式制定具體計劃
* 實施部署:根據設計和規劃,在各部門進行系統實施和部署
* 持續優化:在后續過程中,根據使用進行階段性分析總結并調整系統達到最優狀態
整個項目實施過程分成以下幾個重要環節,作為一個完整的IT 項目,傳統的項目管理理論一樣適用,但是在此之外,需要特別注意以下四個環節的階段性目標,同時采用分步實施的方式以確保項目組成員可以跟隨實施過程熟悉ITSM/ITIL 相關理論。
* 現狀分析:分析現有IT 部門情況,找到了目前效率不高、服務沒有標準化、無法提供有效的量化數據進行分析決策、各人經驗集中在自己手中等問題
* 角色定義:針對實際管理需求,設置了一線、二線、值班經理等角色,以及不同角色對應需要掌握的技能和工作職責;以及各個角色之間如何協調,從而從行政和組織結構上明確了各自的工作職責和目標,這個是ITSM/ITIL 系統實施成功的保證
* 流程定義:針對日常維護的設備、問題、不同角色之間的協作方式,確定了事故管理、問題管理、變更管理、配置管理等幾個流程的流轉細節和不同角色之間的協作模型,從而確保業務環節流程化,把無序的救火變成了有序的預防管理,也在流程中慢慢體現了ITIL 理論的優點,各個角色崗位發揮出較好的效率
* 軟件開發實施:在角色、組織結構、基本流程確定后,利用軟件從技術角度固化流程和實現必要的支撐系統,從而讓管理思想和流程可以沉淀為一個流水線,進入高效運營狀態
在實施系統過程中,針對ITIL 各個流程的具體實施過程和效果如下。
* 服務臺管理:提供統一的Web 入口,維護人員可以通過服務臺進行事件/故障的查詢、人工錄入、轉派、處理、跟蹤等操作。
* 事故管理:把網絡故障、主機故障、數據庫事件、安全事件通過自動觸發方式進入事件數據庫,人為添加的事件也一并進行處理。事件分級分類,IT 人員可以迅速定位和根據歷史信息、知識庫找到處理的方式和建議,對于確實存在的問題轉入問題管理流程。
* 問題管理:在一線、二線、經理之間建立一個問題處理流程,并進行跟蹤;可以井然有序的管理所有出現的問題。
* 變更管理:對于有些設備和服務器確實需要進行設備更換、硬件升級,軟件安裝等變更的事情進行系統記載和追蹤。確保每次變更都是記錄的,經過恰當的審批的。
* 配置管理:通過Unicenter AMO 資產管理模塊自動收集了全部設備和安裝軟件清單,在此基礎上添加許多業務管理需要的但是管理軟件不能收集到的設備數據,加上手工對部分存儲等設備進行處理,并通過機器名增加配置項(各種設備和信息之間的邏輯關系),使得資產和設備等的管理清晰化,符合用戶的管理習慣。
項目實施效果
系統建設后,基本達到了開始的預期目標;以往,不到10 個系統管理員需要管理南航如此數量多的服務器,以及需要向這么多業務部門提供業務支撐和服務,所有的技術人員基本上經常處于高度緊張的狀態,服務質量也無法得到保證;現在,通過實施服務臺管理,工作效率和服務質量都得到了大幅的提高,以前緊張而混亂的局面再也不復存在了。
實施服務臺管理,具體達到了以下這些效果:
* 提高了工作效率:IT 人員加強了對組織結構的認識以及基于流程的處理方式,讓不同角色的人員很清晰的認識到了自己的職責以及如何和其他人員協作,將原先以工作內容分工的方式替換為以流程為主線;通過流程的優化和角色、職責劃分,顯著提高了效率,通過流程規范不同角色和人員從事各自擅長的工作,分工又協作;從而大大提高了工作效率和服務質量,以及協助形成規范化過程。
* 提高了服務質量:將用戶所報故障,管理軟件收集的系統,數據庫,安全,應用軟件事故集成到服務臺,分級分類,在處理的全過程進行跟蹤監控,使IT 服務處在可控的狀況下。所有服務和處理被量化記錄,降低了重復處理問題所浪費的時間,同時還可以對每個人處理事情的能力進行量化評估;管理員借助服務臺系統不再擔心問題沒人處理,因為系統會在適當的時候進行提示,確保了服務質量。
* 提供了大量的分析報表:以及提供可以自由定義的報表工具,可以輕松的制作和生成曾經需要多人工作多天才能制成的報表,現在可以做到隨時“按需提供”了;系統主要提供了以下一些報表,用于管理和分析使用:
* 機器性能報表:可以通過性能報表分析一個階段內機器/數據庫的性能如何,從而決定下階段是否需要添置設備、調整業務峰值點、尋找故障和性能瓶頸是否有關聯關系等
* 資產清單報表:快速獲取資產清單
* 不同階段資產變動表:可以獲取一個階段內的資產設備變化情況,在此也是配置管理中的配置項的變化
* 故障分析報表:從時間、故障類型、分布機器等進行故障分析,從而預測故障產生的情況和進行避免
* 人員工作量統計表:從時間和工作量角度量化數據
* 節省了IT 投入成本:可以在大量的歷史數據中對一段時間中的故障、設備、處理情況等進行分析和挖掘,從而獲得大量有用的決策信息;節省了IT 投入成本;
* 為業務提供了一個可靠高效的IT 環境:IT 管理部門人員從“救火員”變成了“保健員”,不再處于一個高度緊張的狀態,整個IT 系統在可控制和規律的情況下得到了集中管理和維護,為業務提供了一個可靠高效的IT 環境。
* 實現知識共享。系統實施前,維護經驗和知識積累在個人手中,而沒有形成知識共享,無法借鑒其他人的處理經驗;系統實施后,重點問題進入知識庫,成為了公司而非個人資產,可以在所有相關人員之間進行知識共享,提高了解決問題的效率。
經驗和教訓
1. 項目成功的關鍵因素
項目組成員深入了解ITIL 理論,并結合實際情況進行合理的分步實施,確保全體團隊成員基本熟悉ITIL 基本流程規范;
把握每個流程的優先級順序,首先是事件、故障,然后才是配置管理流程,在流程實施過程中,人力/角色的清晰遠遠大于系統中的流程支持;
在重視系統建設的同時,同樣重視組織結構和流程的設計,從而確保技術和業務流程、人員都得到同樣的提升,最終才能實現一個集中高效的IT 服務管理體系,從整體上提升TI部門和企業的管理效率和服務水平。
在項目過程中,系統管理員和項目經理進行充分的配合,從而可以更快的去解決遇到的問題;在實施過程中遇到了各種技術難點以及業務和技術要求之間的矛盾,項目組通過對相似案例的研究以及項目組成員的探討,同時參考ITIL 規范中的一些建議去獲得最終解決方案。
2. 項目實施過程中的經驗和教訓
通過這個相對不是很復雜的ITSM 系統建設,充分認識到理論和方法論對系統建設的重要性;也不能為了系統而建設系統,需要時刻關注系統建設的核心目標是:做到技術、業務、服務結合,達到在IT 服務管理方面的目標。
ITSM 一方面是技術,但更重要的是管理,在變革的過程中會有平衡。項目的建設不要貪求大而全,全面實施所有的流程,而是要針對具體IT 環境,業務環境,組織環境,分析哪些流程是實施后具有現實成效的,是在現實的管理環境下能夠產生效益的。
對于ITIL 中的服務支持相對容易實施,但是服務提供部分需要經過嚴密的考慮和分析設計后才能達到預期的目的,從而使整個項目走向成功。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄