大規模電力企業數據網覆蓋企業各級單位及生産營業節點,其上承載大量管理(lǐ)信息業務。近年(nián)來通過開展優化整合工作,實現數據通信骨幹網向省級及以下數據網絡的(de)技術标準延伸和(hé)網絡架構延伸,全網技術體制标準統一(yī)、網絡結構清晰。改造之前主要存在以下三種運維模式:省、地(dì)市、縣一(yī)體化模式;地(dì)市縣公司一(yī)體化模式;省、地(dì)市、縣獨立運維模式。但随着網絡的(de)改造,這三種運維管理(lǐ)模式已經不适應新的(de)網絡管理(lǐ)需求。 企業數據網邊界延伸至地(dì)市後,主要從網絡架構、網絡規模和(hé)覆蓋範圍、路由控制三個方面說明網絡變化,進而分析運維管理(lǐ)所面臨的(de)新挑戰、新風險。(1)網絡架構上。省內(nèi)網絡扁平化。省級機構不再作為(wèi)本省業務的(de)彙聚點,省級機構本部作為(wèi)一(yī)個地(dì)市級節點,與其他地(dì)市節點一(yī)起直接通過骨幹網與總部對接。網絡結構的(de)變化,使得原有“總部-省”兩級網絡運維體系出現了不适應。(2)網絡規模和(hé)覆蓋範圍上。網絡規模和(hé)覆蓋範圍的(de)變化,使得總部很難全面、高(gāo)效的(de)對網絡運行進行深入管理(lǐ)。由于骨幹域[5]邊界擴大至地(dì)市,骨幹域設備數量增加了數倍,運行管理(lǐ)的(de)深度很難保持原有質量。(3)路由控制上。由于總部至省級機構的(de)邊界已經不存在,已無法沿用原有在省、地(dì)市邊界部署路由控制手段以限制故障影響範圍的(de)模式,而必須采用通過兩級路由反射器(RR)進行集中路由控制的(de)手段,即路由控制模式從分布式走向集中式典型數據網絡運維模式。
典型數據網絡運維模式
▲▲▲▲▲
(一(yī))中國電信
中國電信采用總部、省公司、地(dì)市公司三級運維管理(lǐ)體系。按照管理(lǐ)與操作分離(lí)的(de)原則,進一(yī)步劃分為(wèi)專業管理(lǐ)條線和(hé)運維操作條線。
在全網運維專業管理(lǐ)的(de)條線上,包括職能管理(lǐ)與業務管理(lǐ)兩個方面,其中:職能管理(lǐ)部門的(de)三個級别機構包括集團公司、省公司及地(dì)市公司(本地(dì)網),職能管理(lǐ)部門掌握人财物的(de)資源管理(lǐ)權限;業務管理(lǐ)部門的(de)三個級别機構包括集團公司運維部、省公司運維部及地(dì)市公司網絡部,三個級别的(de)運維部門屬于相應層級機構的(de)管理(lǐ)部門,負責本層級運維工作的(de)統籌協調與考核管理(lǐ),以及面向下級運維部門的(de)标準規範制定,指導意見下發、運維資源配置以及考核評價的(de)管理(lǐ)職能。中國電信網絡運維管理(lǐ)體系如(rú)下圖所示。
在全網運維運維操作的(de)條線上,總體上采用兩級監控集中,屬地(dì)維護操作的(de)模式,其中:集團公司運維部下設集團NOC中心,負責全國骨幹網傳輸、交換、數據、移動等通信專業的(de)集中監控、配置、調度、資源管理(lǐ)等;省公司運維部下設省NOC中心,負責本省各通信專業的(de)集中監控、配置、調度、資源管理(lǐ)等;地(dì)市公司網絡部下設網絡監控維護中心/團隊,主要負責屬地(dì)通信網絡的(de)維護工作,除保留部分末梢線路的(de)監測與測試外,其餘網絡監控職責全部上收。中國電信面向各級NOC/監控維護中心采用矩陣式模式:上級NOC中心對下級NOC中心開展業務層面的(de)縱向調度并提供專業支持,并對下級NOC具備考核打分權,并通過網管工單系統記錄各環節執行情況作為(wèi)重要的(de)考核依據;同時,各級NOC接受本級網絡部的(de)職能管理(lǐ),包括中心領導任免、成本費用預算管理(lǐ)、中心考核管理(lǐ)等。
(二)某能源央企
該企業的(de)數據網絡基于MPLS VPN網絡架構,所有機構的(de)PE均統一(yī)為(wèi)一(yī)個AS域內(nèi),且根據機構的(de)地(dì)理(lǐ)區域集中情況及傳輸資源配套情況,進行了片區網絡的(de)劃分;AS VPN劃分邏輯根據組織機構進行劃分,建有一(yī)級縱向VPN、一(yī)級共享VPN、二級縱向VPN。該企業的(de)MPLS VPN網絡在企業所有層級機構的(de)IP地(dì)址段、RD/RT、路由協議、VPN劃分、接入鏈路類型及帶寬均設置标準化要求。
1.運維體系結構
該企業MPLS VPN網絡的(de)運維體系,劃分為(wèi)網絡管理(lǐ)及網絡操作兩個條線。網絡管理(lǐ)條線涉及的(de)機構包括總公司ITC;網絡操作條線中涉及的(de)機構包括集團網管中心、各片區網管中心以及各業務單位的(de)網管專崗。具體運維體系層次圖見下圖所示。
2.網絡運維流程
該企業集團的(de)MPLS VPN網絡運維體系的(de)組建以總公司、二級單位等行政管理(lǐ)歸屬為(wèi)基本單元,采用運維管理(lǐ)集中,運維操作分散等模式:總公司ITC負責統一(yī)的(de)運維管理(lǐ);集團網管中心、片區網管中心和(hé)業務單位網管專崗分别按照所屬層級進行具體的(de)維護工作。
集團網管中心、片區網管中心和(hé)業務單位維護專崗分工協作、相互配合,共同做(zuò)好MPLS VPN網絡運行與保障工作。MPLS VPN網絡的(de)運行維護界面劃分如(rú)下圖所示。
(三)運維需求和(hé)趨勢分析
公司已經開始關注對電力通信系統運維體系的(de)集中化管理(lǐ)探索,并在部分省公司開展了“省地(dì)一(yī)體化運維”試點工作,以期進一(yī)步提升網絡運維管理(lǐ)水平與運維資源的(de)配置效率。在公司數據通信網開展運維體系的(de)優化探索,除上述驅動因素外,也符合公司電力通信系統運維體系改造的(de)整體方向和(hé)業界發展的(de)一(yī)般趨勢。
基于上述兩個典型案例的(de)分析,各單位在數據通信網運維管理(lǐ)體系模式的(de)選擇上,并不存在标準模型,一(yī)般都會以集中化、标準化為(wèi)前提,根據自(zì)身的(de)能力條件、業務需求,在企業整體管理(lǐ)框架內(nèi)選擇合适的(de)路徑。對于電力企業而言,在運維管理(lǐ)體系建設上,需要電力通信體系框架相适配,與企業發展戰略相銜接,還要考慮當前企業數據網運維體系的(de)整體特征和(hé)資源限制。
▲▲▲▲▲
運維管理(lǐ)模式研究
數據網延伸将網絡的(de)邊界擴展至地(dì)市公司,在運維管理(lǐ)上,比之前的(de)數據網骨幹網、省內(nèi)數據網等,無論從維護範圍、維護難度、維護風險等方面來講,都提出了更高(gāo)的(de)要求。為(wèi)實現全網的(de)正常運轉和(hé)成效的(de)整體發揮,需要基于數據網全網運維管理(lǐ)的(de)特征和(hé)業務承載的(de)總體要求,對現有運維模式進行審視(shì)梳理(lǐ),結合業界在網絡運維管理(lǐ)方面的(de)成熟經驗和(hé)理(lǐ)念,實現運維調度指揮有力、網絡資源管理(lǐ)清晰、運維操作專業規範、運維協同有序可(kě)控。
傳統的(de)網絡運維模式從網絡架構、網絡規模和(hé)覆蓋範圍、路由控制三個方面都無法滿足新的(de)網絡管理(lǐ)需求。網絡結構的(de)變化,使得原有“總部-省”兩級網絡運維體系出現了不适應。骨幹域設備數量增加了數倍,運行管理(lǐ)的(de)深度很難保持原有質量。由于總部至省級機構的(de)邊界已經不存在,已無法沿用原有在省、地(dì)市邊界部署路由控制手段以限制故障影響範圍的(de)模式。
(一(yī))模式一(yī)
數據通信骨幹網(核心層、彙聚層、骨幹層)所有設備由總部統一(yī)進行監控、配置并組織應急處置,各省級機構承擔屬地(dì)維護職責。
管理(lǐ)模式為(wèi):數據通信骨幹網設備及網絡的(de)路由策略制定、規範制定以及涉及全網範圍的(de)項目投資和(hé)網絡優化權限全部上收至總部層面,網絡設備運行監視(shì)、配置管理(lǐ)、調度協調、資源分配、故障處理(lǐ)均由總部負責,省級機構負責本地(dì)接入網設備維護并配合總部開展設備基礎環境維護等現場工作。
具體分工為(wèi):總部直接負責數據通信骨幹網所有設備的(de)運行維護,各省級機構負責數據網接入網(地(dì)市、縣級網絡)設備的(de)運行維護。
(二)模式二
所有骨幹域內(nèi),以原有的(de)省級機構部署的(de)總部PE設備為(wèi)界,總部PE及以上設備由總部負責進行監控、配置并組織應急處置,各省級機構承擔屬地(dì)維護職責;省公司與總部對接PE設備及省內(nèi)PE設備由省級機構負責運維。
管理(lǐ)模式為(wèi):保留原有數據網骨幹網與省級及以下數據網的(de)運維界面不變。業務VPN的(de)配置管理(lǐ)、調度協調、資源分配、故障處理(lǐ)則根據業務等級分别由總部和(hé)省級機構負責。
具體分工為(wèi):總部負責公司數據網骨幹網的(de)核心層所有設備的(de)運行維護,各省級機構負責轄區內(nèi)數據網骨幹網(除省級機構核心機房及彙聚點的(de)骨幹網彙聚層PE設備)及數據網接入網(地(dì)市、縣級網絡)所有設備的(de)運行維護。
(三)模式三
數據通信骨幹網所有設備(除總部辦公區PE設備外)均按照屬地(dì)進行拆分,本地(dì)省級機構負責網絡監控、運行維護和(hé)應急處置。總部負責省際業務的(de)監控和(hé)協調處置。
管理(lǐ)模式為(wèi):數據通信骨幹網設備及網絡的(de)路由策略制定、規範制定以及涉及全網範圍的(de)項目投資和(hé)網絡優化權限全部上收至總部層面,網絡設備運行監視(shì)、配置管理(lǐ)、調度協調、資源分配、故障處理(lǐ)則由屬地(dì)省級機構負責。
具體分工為(wèi):總部直接負責數據通信骨幹網的(de)總部核心節點設備的(de)運行維護,各省級機構直接負責轄區內(nèi)數據通信骨幹網所轄範圍內(nèi)及數據網接入網(地(dì)市、縣級網絡)設備的(de)運行維護。
(四)對比分析
模式一(yī):強調總部在骨幹域的(de)全網監控和(hé)集中管理(lǐ),以及省級機構在地(dì)市接入網絡的(de)集中監控和(hé)集中管理(lǐ),可(kě)以實現由總部一(yī)家運維單位實現總部到地(dì)市層面的(de)一(yī)級業務端到端部署維護能力。總部運維單位全面掌握骨幹區域的(de)網絡資源情況和(hé)運行狀态信息,因此在業務的(de)資源配置效率、方案制定準确度和(hé)業務部署排障過程中,均具備高(gāo)度的(de)方案統一(yī)性和(hé)操作準确性。
模式二:業務需求環境方面,适合全網一(yī)級業務系統總體數量不大,省內(nèi)二級業務占比大、複雜性高(gāo)或調整量大的(de)情況;維護能力環境方面,由于在整體體系架構和(hé)各層級運維定位基本不變,對各級維護能力的(de)需求變化不大,比較适合各省維護體制和(hé)管理(lǐ)模式差異較大的(de)情況;網絡管理(lǐ)系統環境方面,總部具備統一(yī)網管對骨幹域內(nèi)的(de)所有設備進行網元監控、告警分析的(de)網管系統能力,省級機構需具備統一(yī)網管對省內(nèi)地(dì)市域的(de)所有設備進行網元監控、告警分析的(de)網管系統能力。
模式三:業務需求環境方面,對于一(yī)級業務與二級業務的(de)操作配置上區别不大;維護能力環境方面,對各級維護能力的(de)需求變化不大;網絡管理(lǐ)系統環境方面,總部需具備統一(yī)網管對骨幹域內(nèi)的(de)所有設備進行網元監控、告警分析;省級機構需具備統一(yī)網管對省內(nèi)地(dì)市域的(de)所有設備進行網元監控、告警分析的(de)網管系統能力。
(五)運維管理(lǐ)模式推薦方案
綜合上述分析結論,在各省二級業務應用比重大、省內(nèi)業務需求複雜,各省運維管理(lǐ)邏輯存在差異、網管工具尚待完善、人員配置和(hé)能力存在瓶頸的(de)情況下,模式二對現有體制沖擊小,業務影響風險低(dī),同時又兼顧了數據通信網的(de)适度集中的(de)運維管理(lǐ)特點,具有較高(gāo)的(de)現實可(kě)行性。
但是,模式二雖然能夠部分保留原有的(de)運維界面,但對于延伸後的(de)骨幹區域,很難實現運維界面的(de)界定及運維流程管理(lǐ),延伸後在骨幹域內(nèi)需同時考慮地(dì)市之間跨域訪問也要考慮跨省之間的(de)訪問情況,但在同一(yī)個域內(nèi)的(de)設備上将會有總部與省級機構同時管理(lǐ)的(de)情況出現,對于權限與責任的(de)劃分很難通過技術手段實現,對于這種多業務承載,網絡規模超大型的(de)網絡存在一(yī)定的(de)風險。
因此,研究建議以模式二作為(wèi)臨時過渡模式,最終以模式一(yī)指導開展數據網的(de)運維工作,後續着重關注人員能力的(de)培養、網管工具的(de)完善、制度規範的(de)健全、以及運維經驗的(de)積累,最終實現數據網的(de)運維模式。
結語
▲▲▲▲▲
針對電力企業數據網廣域網骨幹域到地(dì)市的(de)情況,本文結合當前運維存在的(de)問題和(hé)風險點,借鑒典型企業運維管理(lǐ)模式,提出了三種不同的(de)運維模式。短(duǎn)期階段建議模式二,後續随着網管建設完成、人員能力具備的(de)情況下逐步向集中式管理(lǐ)的(de)模式一(yī)過渡。