相信大家都聽過網絡環路這個詞吧(ba),網絡環路會對企業網絡存在很大的(de)威脅,它會造成網絡裏的(de)廣播風暴,耗盡交換資源,造成交換機癱瘓,最終導緻的(de)就是直接的(de)經濟損失。今天我們就來聊聊,環路的(de)産生、排查、解決以及如(rú)何防範。
什麽是環路
以太網交換網絡中為(wèi)了提高(gāo)網絡可(kě)靠性,通常會采用冗餘設備和(hé)冗餘鏈路,然而現網中由于組網調整、配置修改、升級割接等原因,經常會造成數據或協議報文環形轉發,不可(kě)避免的(de)形成環路。如(rú)圖所示,三台設備兩兩相連就會形成環路。當設備未部署環路保護協議或者組網配置發生變更時,環形組網中就可(kě)能會産生廣播風暴。
環路的(de)危害
二層環路最大的(de)危害就是會産生廣播風暴,以太網是一(yī)個支持廣播的(de)網絡,在沒有環路的(de)環境中,廣播包在網絡中以泛洪的(de)形式被送達到網絡的(de)每一(yī)個角落,以保證每個設備都能夠接受到它。在帶寬允許的(de)情況下,每個網橋在接收到廣播報文以後,都會向除接收端口以外的(de)其他所有接口轉發這個廣播包,一(yī)旦網絡中有環路,這種簡單的(de)廣播機制就會引發災難性後果。
環路中一(yī)個廣播報文被反複轉發了千萬次,産生了廣播風暴并且很快達到或接近端口線速,并迅速消耗鏈路帶寬。根據轉發規則,這些廣播報文不僅僅隻是在環路上無限轉發,環路設備還會向其他端口轉發一(yī)份,這樣整個網絡中都充斥着大量重複廣播報文。
二層網絡設備處于同一(yī)個廣播域下,廣播報文在環路中會反複持續傳送,無限循環,形成廣播風暴,引發MAC地(dì)址表不穩定等現象描述,進而影響正常業務,導緻用戶通信質量較差,甚至通信中斷。
如(rú)何判斷環路故障
所有這些誘發故障的(de)內(nèi)在因素絕大多數都有其“外在異常表現”,具體會反映在特定網元的(de)告警、日志、流量統計、端口狀态等信息中。因此故障快速定位的(de)關鍵在于,如(rú)何有效而快速的(de)通過事發時間、影響範圍、所做(zuò)操作及故障網絡範圍的(de)網元基本信息的(de)查看,快速發現這些“外在異常表現”所在的(de)點,進而鎖定故障網元節點,找出原因分析。
環路故障診斷步驟
判斷網絡中是否存在二層環路,一(yī)般可(kě)以使用查看接口帶寬流量、查看MAC漂移告警、部署環路檢測、查看CPU占用率四種方法進行确認。這四種方法沒有嚴格的(de)操作順序,為(wèi)更加準确判斷故障屬性,可(kě)以使用其中的(de)一(yī)種或多種方法來進行問題定位。
如(rú)何快速破環
以太網環路會在短(duǎn)時間內(nèi)形成數據風暴,當端口的(de)流量達到帶寬的(de)最大負荷,會形成鏈路擁塞,影響網絡業務。因此,在确認現網存在數據環路後,需要第一(yī)時間按照如(rú)下步驟處理(lǐ),盡快恢複數據業務。
梳理(lǐ)網絡拓撲并識别環路
環形網絡拓撲一(yī)般較為(wèi)複雜,可(kě)以尋求到網絡拓撲結構全圖,具體到網絡的(de)VLAN規劃信息,每台設備名稱、系統MAC、管理(lǐ)IP,本端端口名稱、對端端口名稱。
完整的(de)拓撲信息是解決環路問題的(de)首要條件,如(rú)果沒有拓撲圖,需要從發現環路的(de)設備,通過逐跳登錄,記錄設備信息、端口信息和(hé)VLAN信息,手動繪制完整的(de)拓撲。
緊急破環
緊急破環又稱手動破環,當網絡風暴嚴重影響正常的(de)業務時,需要使用此方法盡快恢複業務。
端口退出已成環的(de)VLAN
在已經成環的(de)網絡上,将其中一(yī)個端口退出成環VLAN,屬于影響面最小的(de)破環方法。
shutdown已經成環的(de)端口
shutdown已經成環的(de)物理(lǐ)端口,也可(kě)以達到破環的(de)效果。需要注意的(de)是執行此動作之前,您需要确保在接口視(shì)圖下執行命令shutdown關閉接口後,不會影響正常的(de)數據業務。
拔出成環接口破環
通過拔出成環的(de)端口的(de)連接光纖或網線,也可(kě)以緊急破環。該方法可(kě)以使用Shutdown端口代替,在設備無法遠程登錄時可(kě)以使用。
确認業務已經恢複
通過Ping等操作測證網絡通信質量,并觀察現網業務是否已經恢複。環路拓撲存在冗餘鏈路和(hé)配置,因此環路破除後業務一(yī)般會自(zì)行恢複。
網絡加固和(hé)優化
部署适當的(de)破環協議
如(rú)果當前的(de)環路問題是由于物理(lǐ)環路引入,按照網絡規劃合理(lǐ)部署破環協議。以太網交換機常見的(de)破環協議為(wèi)STP/RSTP/MSTP/VBST、RRPP、SEP、ERPS等。
部署廣播抑制提升網絡健壯性
為(wèi)了避免再次成環,成環後再次引入數據風暴,建議在環上設備端口下,部署廣播抑制,按照經驗,部署5%的(de)廣播抑制可(kě)以很好的(de)防止廣播風暴,具體抑制的(de)比例值可(kě)以按照現網并發廣播流量來評估确認。
優化網絡設計,提升網絡
複雜組網可(kě)以通過分層控制,建議合理(lǐ)規劃設計接入層、彙聚層,通過堆疊、集群等橫向虛拟化技術簡化網絡架構。單層組網內(nèi)設備數量較多時,建議按照邏輯組織和(hé)地(dì)理(lǐ)分布,劃分不同的(de)域。