首頁 > 精品范文 > 網(wǎng)絡(luò)故障
時(shí)間:2022-10-02 09:42:37
序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇網(wǎng)絡(luò)故障范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
關(guān)鍵詞:網(wǎng)絡(luò)故障;故障檢測(cè);故障定位;故障診斷;專家系統(tǒng);數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP393.06
隨著計(jì)算機(jī)、通信以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展及應(yīng)用,網(wǎng)絡(luò)作為一種重要的工具,在軍事、政治、經(jīng)濟(jì)和科研等諸多領(lǐng)域起著越來越重要的作用,已經(jīng)成為社會(huì)生產(chǎn)和生活必不可少的一部分。與此同時(shí),網(wǎng)絡(luò)的規(guī)模和復(fù)雜性不斷增大,一旦網(wǎng)絡(luò)發(fā)生故障,如果不能在有效時(shí)間內(nèi)對(duì)網(wǎng)絡(luò)故障進(jìn)行診斷與修復(fù),將會(huì)造成巨大的損失,甚至嚴(yán)重威脅社會(huì)的安全與穩(wěn)定,因此對(duì)網(wǎng)絡(luò)故障診斷技術(shù)進(jìn)行研究具有越來越重要的應(yīng)用價(jià)值和現(xiàn)實(shí)意義。
1 網(wǎng)絡(luò)故障診斷一般過程
通常來說,網(wǎng)絡(luò)故障診斷是以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運(yùn)行的知識(shí)為基礎(chǔ),根據(jù)網(wǎng)絡(luò)出現(xiàn)的故障現(xiàn)象,并使用專門的網(wǎng)管理和檢測(cè)工具以獲取告警信息進(jìn)而對(duì)網(wǎng)絡(luò)中出現(xiàn)的故障進(jìn)行診斷、恢復(fù)以及預(yù)測(cè)的過程,一般可分為以下五個(gè)部分[1]:
(1)故障檢測(cè),即網(wǎng)絡(luò)故障告警信息的獲取。網(wǎng)絡(luò)發(fā)生故障時(shí),通過主動(dòng)輪詢或異步收集方式,對(duì)網(wǎng)絡(luò)中的相關(guān)設(shè)備或服務(wù)的相關(guān)告警信息、設(shè)置和性能參數(shù),狀態(tài)信息等進(jìn)行收集和分析,及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)出現(xiàn)的故障及問題。
(2)故障定位,即定位故障源。對(duì)故障檢測(cè)階段收集的海量告警數(shù)據(jù)進(jìn)行分析和處理,在網(wǎng)絡(luò)中找出故障,為下一步的故障原因的診斷提供依據(jù)。
(3)故障原因的診斷,即查找故障產(chǎn)生的根源。根據(jù)故障定位的結(jié)果綜合運(yùn)用各種規(guī)則進(jìn)行系統(tǒng)的推理,快速的找到故障產(chǎn)生的原因或者最可能的原因。
(4)故障修復(fù)。根據(jù)網(wǎng)絡(luò)故障診斷結(jié)果修復(fù)網(wǎng)絡(luò)故障,恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行。
(5)故障預(yù)測(cè),即根據(jù)先驗(yàn)知識(shí)和監(jiān)測(cè)數(shù)據(jù)預(yù)測(cè)網(wǎng)絡(luò)可能發(fā)生的故障。
其中故障檢測(cè),故障定位,故障原因診斷是必不可少的三個(gè)步驟,下面將重點(diǎn)對(duì)上述三個(gè)步驟進(jìn)行詳細(xì)的介紹。
2 網(wǎng)絡(luò)故障檢測(cè)
通常計(jì)算機(jī)網(wǎng)絡(luò)通過以下兩種方式收集信息,通過分析收集到的信息來檢測(cè)故障[2]。
(1)Trap機(jī)制。在網(wǎng)絡(luò)中每一個(gè)被管設(shè)備中都要運(yùn)行一個(gè)程序以便和管理站中的管理程序進(jìn)行通信。
(2)主動(dòng)輪詢。網(wǎng)絡(luò)中發(fā)生故障的被管設(shè)備或服務(wù)主動(dòng)向網(wǎng)絡(luò)管理系統(tǒng)發(fā)出告警信息,能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)中的故障,網(wǎng)絡(luò)管理系統(tǒng)還需通過主動(dòng)輪詢這種方式了解與網(wǎng)絡(luò)性能密切相關(guān)的信息,并對(duì)這些影響網(wǎng)絡(luò)性能信息設(shè)置閾值,來判斷網(wǎng)絡(luò)性能,超過設(shè)定閾值也會(huì)觸發(fā)事件。
3 網(wǎng)絡(luò)故障定位
網(wǎng)絡(luò)系統(tǒng)中,一般通過監(jiān)測(cè)被管設(shè)備或服務(wù)等各種方法獲取大量原始告警數(shù)據(jù)或歷史積累信息,這些數(shù)據(jù)往往由于通信系統(tǒng)的復(fù)雜性、網(wǎng)絡(luò)結(jié)構(gòu)異構(gòu)性、噪聲、外界因素、因果關(guān)系等原因而具有相當(dāng)大的不確定性和不精確性,導(dǎo)致故障癥狀和故障原因都存在非線性映射關(guān)系,需要利用關(guān)聯(lián)技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理和分析才有效的進(jìn)行故障定位[3],目前常用的故障定位技術(shù)主要有下面幾種:
3.1 基于人工智能的故障定位技術(shù)
3.1.1 基于規(guī)則的推理技術(shù)
基于規(guī)則的推理(Rule-based Reason,RBR)是最簡(jiǎn)單的關(guān)聯(lián)技術(shù),已被用于多種構(gòu)架。一般而言,基于規(guī)則的系統(tǒng)由三個(gè)組成部分組成,如圖1所示。
(1)推理引擎,主要提供解決問題所需要的策略。
(2)知識(shí)庫,提供和定義與問題相關(guān)的規(guī)則和專家知識(shí)。
(3)工作內(nèi)存,主要提供解決問題所需要的數(shù)據(jù)。
在基于規(guī)則的推理的網(wǎng)絡(luò)故障定位系統(tǒng)中,知識(shí)庫充當(dāng)一個(gè)專家的角色,利用從人類專家獲取專家積累的經(jīng)驗(yàn)和知識(shí),這些知識(shí)主要包括對(duì)網(wǎng)絡(luò)問題的定義以及當(dāng)某一特定問題發(fā)生時(shí),網(wǎng)絡(luò)故障定位系統(tǒng)需要執(zhí)行的操作。工作內(nèi)存主要是利用具體的網(wǎng)絡(luò)協(xié)議對(duì)網(wǎng)絡(luò)中的被管設(shè)備或服務(wù)進(jìn)行監(jiān)測(cè),得到有關(guān)被管設(shè)備或服務(wù)的各種信息。在對(duì)網(wǎng)絡(luò)故障進(jìn)行定位時(shí),推理引擎與知識(shí)庫共同合作,將監(jiān)測(cè)得到的網(wǎng)絡(luò)中被管設(shè)備或服務(wù)的狀態(tài)信息與知識(shí)庫中定義好的條件部分進(jìn)行比對(duì),根據(jù)條件滿足與否,來進(jìn)行網(wǎng)絡(luò)故障的定位。
基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng),由于無需對(duì)專家系統(tǒng)的具體結(jié)構(gòu)和操作細(xì)節(jié)進(jìn)行深入了解,從而具有結(jié)構(gòu)簡(jiǎn)單等諸多優(yōu)點(diǎn),并且實(shí)現(xiàn)起來比較簡(jiǎn)單,非常適用于小型系統(tǒng)。但是基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)在匹配規(guī)則時(shí),需要網(wǎng)絡(luò)狀態(tài)與知識(shí)庫中的規(guī)則條件精確匹配,否則將推出整個(gè)推理過程,無法定位故障,并且規(guī)則存在不易維護(hù)性和指數(shù)增長(zhǎng)性,所有這些缺點(diǎn)決定了基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)不適用大型系統(tǒng)。
3.1.2 基于模型的推理技術(shù)
基于模型的推理(Model-based Reason,MBR)是建立在面向?qū)ο笊系幕A(chǔ)之上,利用現(xiàn)有的專家經(jīng)驗(yàn)和知識(shí),將具體的目標(biāo)系統(tǒng)中的實(shí)體都模型化診斷對(duì)象,并且明確地表現(xiàn)出現(xiàn)實(shí)目標(biāo)系統(tǒng)中對(duì)象之間存在的各種關(guān)聯(lián)關(guān)系,再根據(jù)系統(tǒng)模型對(duì)具體的目標(biāo)系統(tǒng)的行為進(jìn)行推測(cè)。由于通常情況下,具體的目標(biāo)系統(tǒng)與理想的系統(tǒng)模型之間存在差異性,因此基于模型的推理的專家系統(tǒng)需要對(duì)推測(cè)的行為和目標(biāo)系統(tǒng)的實(shí)際行為進(jìn)行不一致診斷,以確定具體目標(biāo)系統(tǒng)中的故障根源。
為了更好地說明基于模型的推理專家系統(tǒng)的工作流程,文獻(xiàn)[4]使用一個(gè)物理模型和對(duì)應(yīng)的對(duì)等模型分別如圖2、3所示的網(wǎng)絡(luò)系統(tǒng)。網(wǎng)絡(luò)系統(tǒng)按一定的周期,有規(guī)律的向圖2中的被管設(shè)備發(fā)送ping命令以監(jiān)測(cè)網(wǎng)絡(luò)系統(tǒng)中的被管設(shè)備是否運(yùn)行正常。管理系統(tǒng)和被管設(shè)備之間通過一個(gè)模型對(duì)象實(shí)現(xiàn)彼此之間的相互通信,具體來說,如圖2所示,系統(tǒng)中的集線器模型向被管設(shè)備集線器發(fā)送ping命令,路由器模型則向被管設(shè)備路由器發(fā)送ping命令。當(dāng)目標(biāo)網(wǎng)絡(luò)發(fā)生故障時(shí),如果故障發(fā)生在集線器1,則集線器1模型可以將其發(fā)現(xiàn)并且識(shí)別出來,如果集線器1模型連續(xù)3次向被管設(shè)備集線器1發(fā)送ping命令,在3次響應(yīng)超時(shí)以后,集線器模型1根據(jù)現(xiàn)有的網(wǎng)絡(luò)現(xiàn)象推測(cè)被管設(shè)備集線器1有可能發(fā)生故障,或者說目標(biāo)系統(tǒng)中的故障位于集線器1。集線器1模型則會(huì)在確定故障并正式發(fā)送告警信息之前,集線器1模型將分析自身與圖2中其他被管設(shè)備的模型之間的關(guān)系以此來確定其是否應(yīng)該詢問網(wǎng)絡(luò)中路由器模型,如網(wǎng)絡(luò)中的路由器模型返回的是相應(yīng)的被管路由器設(shè)備工作處于正常狀態(tài),則集線器1觸發(fā)警報(bào)。
3.1.3 基于范例的推理技術(shù)
基于范例的推理(Case-based Reason,CBR)故障定位技術(shù)與前面的基于規(guī)則推理技術(shù)和基于模型推理技術(shù)相比具有很大的差異性,主要因?yàn)榛诜独耐评砑夹g(shù)的思想源于人類現(xiàn)實(shí)生活,主要根據(jù)過去積累的實(shí)際經(jīng)驗(yàn)或經(jīng)歷,利用類比的推理方法對(duì)現(xiàn)有的新問題做出相似的解答,然后根據(jù)新問題與舊問題之間的差異對(duì)解答進(jìn)行修改從而得到新問題的完全解答。基于范例推理的網(wǎng)絡(luò)故障定位技術(shù)主要由四個(gè)部分組成,檢索 (Retrieve)、復(fù)用(Reuse)、修正(Revise)、保存(Retain),簡(jiǎn)稱4R過程。
基于范例推理的故障定位技術(shù)與基于規(guī)則推理的故障定位技術(shù)相比,由于在基于范例推理的故障定位技術(shù)中檢索只是基于對(duì)案例的部分匹配,而基于規(guī)則推理的故障定位技術(shù)則是完全匹配,因此基于范例推理的故障定位技術(shù)對(duì)網(wǎng)絡(luò)配置變化的適應(yīng)度更好,更適用于問題的總體解決方案。
3.2 模型遍歷技術(shù)
模型遍歷技術(shù)(Model traversing techniques)是一種構(gòu)建網(wǎng)絡(luò)故障傳播模型的方法,該方法在構(gòu)建故障傳播模型時(shí),主要根據(jù)網(wǎng)絡(luò)在運(yùn)行時(shí)各種被管對(duì)象之間的相互關(guān)系,并且按照從引起事件的被管對(duì)象開始的順序進(jìn)行構(gòu)建。該方法主要適用于網(wǎng)絡(luò)中被管對(duì)象之間的相互關(guān)系類似于圖形,并且一般情況下較容易獲取的情況,并且在系統(tǒng)配置變化較頻繁時(shí)該方法的魯棒性很好。模型遍歷技術(shù)主要具有兩大特點(diǎn),事件驅(qū)動(dòng)和事件關(guān)聯(lián),所謂事件驅(qū)動(dòng)是指在一個(gè)故障癥狀報(bào)告到來之前,系統(tǒng)一直處于等待故障癥狀狀態(tài);事件關(guān)聯(lián)則是確定兩個(gè)故障癥狀是否來源同一個(gè)事件源。
一般情況下,模型遍歷技術(shù)需要在其事件報(bào)告中明確標(biāo)識(shí)網(wǎng)絡(luò)系統(tǒng)中故障的征兆類型、征兆目標(biāo)等相關(guān)信息,如果網(wǎng)絡(luò)系統(tǒng)中出現(xiàn)故障征兆,且不妨用si來表示該故障征兆,當(dāng)si的目標(biāo)和si來源相同,則說明si是一個(gè)次要征兆也就說明某些告警信息可以被忽略。模型遍歷技術(shù)的整個(gè)處理可分為以下3步:
(1)首先,對(duì)網(wǎng)絡(luò)中的每個(gè)事件,依據(jù)網(wǎng)絡(luò)在運(yùn)行時(shí)各種被管對(duì)象之間的相互關(guān)系對(duì)其構(gòu)建一個(gè)和事件源相關(guān)的對(duì)象圖。
(2)當(dāng)給定的兩個(gè)事件的對(duì)象圖相交時(shí),此時(shí)說明兩個(gè)圖至少包含同一個(gè)對(duì)象,則認(rèn)為這兩個(gè)對(duì)象圖的事件源是關(guān)聯(lián)的。
(3)當(dāng)給定三個(gè)故障癥狀si,sj,sk,其中si,sj相互關(guān)聯(lián),sj,sk相互關(guān)聯(lián),則根據(jù)故障癥狀的傳遞性可知si是一個(gè)次要的故障癥狀。
4 網(wǎng)絡(luò)故障原因診斷
(1)基于信號(hào)處理方法。該方法主要是依據(jù)信號(hào)模型,直接對(duì)網(wǎng)絡(luò)系統(tǒng)中的可測(cè)信號(hào)進(jìn)行分析與處理,并通過提取可測(cè)信號(hào)的頻率等特征值,對(duì)網(wǎng)絡(luò)中存在的故障原因進(jìn)行診斷。
(2)基于解析模型的方法。基于解析模型的方法主要依據(jù)數(shù)學(xué)模型和數(shù)學(xué)方法來進(jìn)行故障原因的診斷,在診斷時(shí)需要建立對(duì)象的精確數(shù)學(xué)模型。
(3)基于知識(shí)檢測(cè)的方法。與基于解析模型方法相比,此方法最大的特點(diǎn)在于其并不需要對(duì)象的精確數(shù)學(xué)模型就可以對(duì)網(wǎng)絡(luò)中的故障原因進(jìn)行診斷。
下面主要介紹幾種目前國(guó)內(nèi)外研究學(xué)者研究比較多的基于知識(shí)檢測(cè)的方法,基于專家系統(tǒng)故障原因診斷方法和基于模糊理論故障原因診斷方法以及基于BP神經(jīng)網(wǎng)絡(luò)故障原因檢測(cè)方法。
4.1 基于專家系統(tǒng)故障原因診斷方法
基于專家系統(tǒng)故障原因診斷系統(tǒng)主要是利用人類專家的經(jīng)驗(yàn)和歷史積累診斷數(shù)據(jù),使用一定的方法將其轉(zhuǎn)化為系統(tǒng)能夠識(shí)別的規(guī)則存在專家系統(tǒng)的知識(shí)庫中。當(dāng)網(wǎng)絡(luò)中出現(xiàn)故障時(shí),診斷系統(tǒng)利用專家系統(tǒng)知識(shí)庫中的規(guī)則,對(duì)發(fā)生故障網(wǎng)絡(luò)中的被管對(duì)象的各項(xiàng)性能參數(shù)進(jìn)行處理與分析以正確的確定網(wǎng)絡(luò)故障發(fā)生的具體原因[5]。組成由人機(jī)接口、推理機(jī)、知識(shí)庫等六部分組成:
目前,國(guó)內(nèi)外學(xué)者公認(rèn)的專家系統(tǒng)瓶頸是知識(shí)獲取問題,因?yàn)閷<蚁到y(tǒng)在診斷過程中主要依賴于從人類專家領(lǐng)域內(nèi)獲取的知識(shí)、經(jīng)驗(yàn)和以往診斷數(shù)據(jù),而這些獲取起來途徑有限,操作起來具有一定的局限性和復(fù)雜性。另外,專家系統(tǒng)在實(shí)時(shí)性和學(xué)習(xí)能力等方面也存在一定的局限性,因此目前通常將專家系統(tǒng)同其他方法相結(jié)合以提高專家系統(tǒng)在這些方面存在的局限性和不足。
4.2 模糊故障診斷方法
很多時(shí)候,網(wǎng)絡(luò)中的故障與系統(tǒng)得到的網(wǎng)絡(luò)現(xiàn)象之間存在非線性的映射關(guān)系,這種非線性的映射關(guān)系很難用確定的數(shù)學(xué)公式或者模型來刻畫,相應(yīng)的在故障原因診斷時(shí),很難給出故障的精確原因。相反,只能給出故障發(fā)生的可能原因。對(duì)于這種存在一定模糊性的問題,可以使用模糊邏輯來解決。
目前使用的比較多的是向量識(shí)別法,其診斷過程可分為以下3步:
首先,需要根據(jù)網(wǎng)絡(luò)中的故障與表征網(wǎng)絡(luò)故障的數(shù)據(jù),建立二者之間的關(guān)系,通常用關(guān)系矩陣R來表示。
其次,對(duì)需要診斷的目標(biāo)網(wǎng)絡(luò)系統(tǒng)(對(duì)象)進(jìn)行狀態(tài)檢測(cè),提取相關(guān)的特征參數(shù)以構(gòu)建特征向量矩陣X。
最后,根據(jù)模糊理論和矩陣?yán)碚摚蠼馇懊鎯刹綐?gòu)建的關(guān)系矩陣方程Y=X?R,得到關(guān)系矩陣方程的解Y,再根據(jù)隸屬度等原則,對(duì)目標(biāo)網(wǎng)絡(luò)系統(tǒng)的故障向量Y進(jìn)行處理,得到故障的原因。
從上述診斷過程可知,在模糊故障診斷中,正確的進(jìn)行故障原因診斷的前提是建立關(guān)系矩陣R、隸屬函數(shù)、特征值向量X,而這些矩陣、函數(shù)、向量的建立是人為構(gòu)造而成,難免具有一定的主觀性,并且由于該模糊診斷方法對(duì)特征元素的選取也有一定的要求,所以兩者若處理不當(dāng),會(huì)導(dǎo)致該方法的診斷結(jié)果精度嚴(yán)重下降甚至完全錯(cuò)誤。
4.3 BP神經(jīng)網(wǎng)絡(luò)診斷方法
由于人工神經(jīng)網(wǎng)絡(luò)的這些特性以及網(wǎng)絡(luò)中故障與征兆之間有可能存在的非線性映射關(guān)系,使得人工神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)故障診斷中大有用武之地。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)大量應(yīng)用在網(wǎng)絡(luò)故障診斷領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)是常用的人工神經(jīng)網(wǎng)絡(luò)模型[6]。
BP神經(jīng)網(wǎng)絡(luò)故障診斷分為訓(xùn)練和診斷兩個(gè)階段:
(1)訓(xùn)練階段。BP神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行訓(xùn)練,以選定網(wǎng)絡(luò)結(jié)構(gòu)和規(guī)模,確定網(wǎng)絡(luò)總層數(shù)、各層神經(jīng)元數(shù)。借助BP學(xué)習(xí)算法,將原始網(wǎng)絡(luò)收集到的故障樣本的特征參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)輸入樣本集,以與之對(duì)應(yīng)的網(wǎng)絡(luò)故障原因編碼為BP神經(jīng)網(wǎng)絡(luò)的輸出,以此對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(2)故障診斷階段。主要對(duì)待檢測(cè)對(duì)象的故障樣本進(jìn)行特征提取和歸一化處理,然后輸入到BP神經(jīng)網(wǎng)絡(luò)進(jìn)行診斷輸出診斷結(jié)果,整個(gè)過程分為以下4個(gè)步驟:1)故障樣本集預(yù)處理。2)BP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)。3)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。4)故障診斷。
5 結(jié)束語
本文對(duì)網(wǎng)絡(luò)故障的概念以及基本過程進(jìn)行了概述,重點(diǎn)對(duì)當(dāng)前網(wǎng)絡(luò)故障中的故障檢測(cè)、故障定位、故障診斷的關(guān)鍵技術(shù)及方法進(jìn)行了研究和總結(jié)歸納,對(duì)開展網(wǎng)絡(luò)故障診斷技術(shù)研究具有一定的指導(dǎo)意義。
參考文獻(xiàn):
[1]王成等.網(wǎng)絡(luò)故障診斷技術(shù)研究[J].科技信息,2011(11).
[2]陳琳.一種網(wǎng)絡(luò)環(huán)境中的故障診斷模型[J].北京航空航天大學(xué)學(xué)報(bào),2004(11).
[3]張燕.網(wǎng)絡(luò)故障診斷關(guān)鍵技術(shù)[J].電腦知識(shí)與技術(shù),2009(31).
[4]李千目.戰(zhàn)略互聯(lián)網(wǎng)智能診斷技術(shù)研究[D].南京理工大學(xué),2005.
[5]吳曉知,李興明.網(wǎng)絡(luò)故障管理專家系統(tǒng)中知識(shí)庫的構(gòu)造[J].微計(jì)算機(jī)信息,2008(06).
[6]戚涌,劉鳳玉.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)智能診斷系統(tǒng)[J].微電子學(xué)與計(jì)算機(jī),2004(10).
關(guān)鍵詞:光路傳輸
故障現(xiàn)象:一輛2011年產(chǎn)寶馬740Li轎車,車型為F02,搭載N63發(fā)動(dòng)機(jī),行駛里程2萬km。用戶反映該車中央顯示器黑屏。
檢查分析:維修人員試車發(fā)現(xiàn),該車除顯示器黑屏外其他系統(tǒng)工作正常。通過故障診斷儀查看網(wǎng)絡(luò)圖(圖1),發(fā)現(xiàn)網(wǎng)絡(luò)中光纖局域網(wǎng)部分的網(wǎng)絡(luò)傳輸存在異常。
光纖局域網(wǎng)是通過光路來傳送數(shù)據(jù)的,各控制單元之間的數(shù)據(jù)總線采用光路串聯(lián)方式連接。而對(duì)串聯(lián)方式而言,任何地方出現(xiàn)斷點(diǎn)的話,整個(gè)局域網(wǎng)都會(huì)癱瘓。從網(wǎng)絡(luò)分布圖可以看出,由于車載電腦CIC的光路出現(xiàn)了斷路,所以導(dǎo)致整個(gè)局域網(wǎng)無法傳輸數(shù)據(jù)。
檢查車載電腦CIC的電源,正常。斷開車載電腦CIC的光纜插接器后重新插上,正常情況下插接器會(huì)持續(xù)發(fā)光近10s,表明光路已接通。但該車的插接器卻完全不亮,說明總線驅(qū)動(dòng)器沒有工作。
故障排除:更換CIC,故障排除。
(杜強(qiáng))
奔馳轎車換擋闖車
關(guān)鍵詞:電路接觸不良
故障現(xiàn)象:一輛2011年產(chǎn)奔馳C200轎車,搭載271型發(fā)動(dòng)機(jī)和722.6型自動(dòng)變速器,行駛里程3萬km。用戶反映該車有時(shí)換擋沖擊嚴(yán)重。
檢查分析:維修人員試車,發(fā)現(xiàn)該車換擋沖擊現(xiàn)象實(shí)為偶發(fā)。當(dāng)故障出現(xiàn)時(shí),換入倒擋沖擊非常明顯,這說明故障與油壓控制有關(guān)。檢測(cè)變速器控制單元,未發(fā)現(xiàn)故障碼。檢測(cè)發(fā)動(dòng)機(jī)控制單元時(shí),發(fā)現(xiàn)其保存有與變速器控制單元通信中斷的故障記錄。對(duì)于控制器局域網(wǎng)而言,這類故障通常是由作為通信對(duì)象的控制單元電源中斷引起。
查看變速器控制單元的電路圖(圖2),得知其電源是由前指令接收?qǐng)?zhí)行單元SAM提供的。打開SAM的上蓋,可以看到具體的執(zhí)行元件是一個(gè)繼電器。拔下繼電器測(cè)量各端子之間的電阻,正常。
不插繼電器,將SAM上對(duì)應(yīng)繼電器輸入、輸出端的插座跨接。試車發(fā)現(xiàn)故障不再出現(xiàn),說明故障點(diǎn)就在繼電器內(nèi)部。于是拆開繼電器外殼檢查,發(fā)現(xiàn)其電磁線圈的引線端從接點(diǎn)處翹起(圖3),這導(dǎo)致了電路接觸不良。
故障排除:更換繼電器,故障排除。
(致遠(yuǎn))
奔馳旅行車連桿斷裂
關(guān)鍵詞:連桿彎曲
故障現(xiàn)象:一輛2006年產(chǎn)奔馳R500旅行車,搭載273型V8發(fā)動(dòng)機(jī)和722.9型自動(dòng)變速器,行駛里程14萬km。該車行駛中發(fā)動(dòng)機(jī)缸體突然被連桿洞穿。
檢查分析:維修人員為查明導(dǎo)致這起嚴(yán)重故障的原因,將損壞的發(fā)動(dòng)機(jī)解體檢查。發(fā)現(xiàn)由于1缸連桿斷裂,導(dǎo)致缸體破損(圖4)。據(jù)用戶反映,故障發(fā)生前沒有任何預(yù)兆。那么究竟是什么原因造成了如此嚴(yán)重的后果呢?
仔細(xì)觀察氣缸壁發(fā)現(xiàn),1缸第一道活塞環(huán)留下的活塞上止點(diǎn)印痕有下沉的跡象(圖5)。根據(jù)新印痕的色澤判斷。活塞出現(xiàn)下沉已經(jīng)很久。這表明在故障出現(xiàn)前,1缸連桿早已出現(xiàn)了彎曲。
這就解釋了故障發(fā)生得如此突然的原因。原來連桿出現(xiàn)彎曲后,在彎曲部位便出現(xiàn)了橫向剪切力。隨著發(fā)動(dòng)機(jī)運(yùn)轉(zhuǎn)時(shí)間的增加,連桿受傷部位的疲勞度也在不斷積累。當(dāng)某一瞬間連桿彎曲部位所受到的剪切力大于其承受強(qiáng)度時(shí),連桿便發(fā)生了斷裂。從連桿斷裂處金屬表面的顏色(圖6)也可看出,的確是彎曲在前斷裂在后。
那么又是什么原因?qū)е逻B桿彎曲呢?檢查發(fā)現(xiàn)1缸的進(jìn)排氣門都被頂彎了,但從活塞頂部的印記看(圖7),這應(yīng)是連桿斷裂后,活塞運(yùn)動(dòng)與氣門不同步所造成的。既然氣缸內(nèi)無任何異物,推測(cè)連桿的彎曲是在用戶不知情的情況下由于氣缸進(jìn)水造成的。
故障排除:更換缸體和活塞總成,故障排除。
(王述杰)
高爾夫旅行車行駛異常
關(guān)鍵詞:氧傳感器信號(hào)偏差
故障現(xiàn)象:一輛2012年產(chǎn)進(jìn)口高爾夫旅行車,行駛里程2萬km。用戶反映該車最高時(shí)速超不過60km/h。
檢查分析:維修人員試車,發(fā)現(xiàn)該車怠速運(yùn)轉(zhuǎn)平穩(wěn),但行駛中加速明顯無力。檢測(cè)發(fā)動(dòng)機(jī)控制單元,發(fā)現(xiàn)有氧傳感器的故障提示(圖8)。根據(jù)經(jīng)驗(yàn),若是氧傳感器失效的話,一般不會(huì)對(duì)車輛行駛產(chǎn)生如此嚴(yán)重的影響。但此時(shí)除了此故障提示外,別無其他提示。
為了明確氧傳感器信號(hào)與車輛行駛異常之間的關(guān)系,還是決定先查看與氧傳感器有關(guān)的數(shù)據(jù)。讀取發(fā)動(dòng)機(jī)控制單元第32組數(shù)據(jù)(圖9)時(shí)發(fā)現(xiàn),氧傳感器在怠速時(shí)工作基本正常,但在部分負(fù)荷狀態(tài)下其信號(hào)偏高的自適應(yīng)值卻達(dá)到了極限。根據(jù)車輛的行駛狀況看,氧傳感器的實(shí)際信號(hào)應(yīng)該是超出了其自適應(yīng)的范圍。這樣在部分負(fù)荷條件下,由于氧傳感器的信號(hào)偏差,使噴油量不斷增加,導(dǎo)致混合氣燃燒不良,發(fā)動(dòng)機(jī)輸出扭矩下降。
關(guān)鍵詞:故障樹;網(wǎng)絡(luò)故障;系統(tǒng)研制
中圖分類號(hào):TP393.08 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1007-9599 (2011) 12-0000-01
Network Failure Analysis System Development Based On Fault Tree Theory
Guo Yiwei1,Li Jinsong1,Huang Hongyong2,Xiao Jian2,Du Wenzheng1
(1.Xihua University,School of Mechanical Engineering and Automation,Chengdu610039,China;2.PLA 92762 Troops,Xiamen361000,China)
Abstract:In this paper the fault tree analysis techniques applied to fault diagnosis in computer networks,network management to improve the reliability,stability,flexibility,speed and accuracy of fault diagnosis,rapid network fault diagnosis,prediction and maintenance,to ensure high network service quality and reliability.
Keywords:Fault tree;Network failure;System development
一、引言
隨著計(jì)算機(jī)網(wǎng)絡(luò)的爆炸式的增長(zhǎng)。網(wǎng)絡(luò)無處不在,廣泛的深入到人們的生活,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的完善極大的促進(jìn)了現(xiàn)代社會(huì)的發(fā)展。人們對(duì)網(wǎng)絡(luò)的可靠性也提出了更高的要求:能夠及時(shí)快速的進(jìn)行網(wǎng)絡(luò)故障分析,對(duì)保持網(wǎng)絡(luò)的健康狀態(tài)具有重要的意義。然而隨著網(wǎng)絡(luò)規(guī)模的日益膨脹,網(wǎng)絡(luò)故障分析遇到了極大的困難,其主要表現(xiàn)在以下幾個(gè)方面:
1.現(xiàn)代信息技術(shù)的廣泛應(yīng)用,計(jì)算機(jī)網(wǎng)絡(luò)規(guī)模、網(wǎng)絡(luò)復(fù)雜性和多樣性都有了巨大的發(fā)展。大規(guī)模網(wǎng)絡(luò)的故障關(guān)系錯(cuò)綜復(fù)雜,網(wǎng)絡(luò)故障分析難度越來越大。
2.新的網(wǎng)絡(luò)設(shè)備產(chǎn)品不斷推出,功能越來越多,結(jié)構(gòu)越來越復(fù)雜、產(chǎn)品規(guī)格和標(biāo)準(zhǔn)不完全統(tǒng)一提高了故障診斷的難度。
3.國(guó)際互聯(lián)網(wǎng)深入到人們的生活之中,網(wǎng)絡(luò)信息量急劇膨脹,對(duì)網(wǎng)絡(luò)故障分析提出了越來越高的要求。
二、計(jì)算機(jī)網(wǎng)絡(luò)的層次化體系
為了在所有類型的計(jì)算機(jī)系統(tǒng)之間建立允許通信的網(wǎng)絡(luò)系統(tǒng),人們就推出了OSI參考模型。其含義就是推薦所有公司使用規(guī)范來控制網(wǎng)絡(luò)。這樣所有公司都有相同的規(guī)范,就能相互聯(lián)接。提供各種網(wǎng)絡(luò)服務(wù)功能的計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)是非常復(fù)雜的。根據(jù)分而治之的原則,ISO將整個(gè)通信功能劃分為七個(gè)層次:應(yīng)用層、表示層、會(huì)話層、傳輸層、網(wǎng)絡(luò)層、數(shù)據(jù)鏈路層、物理層。
三、計(jì)算機(jī)網(wǎng)絡(luò)數(shù)據(jù)的傳輸
OSI七層模型的每一層都對(duì)數(shù)據(jù)進(jìn)行封裝(網(wǎng)絡(luò)節(jié)點(diǎn)將要傳送的數(shù)據(jù)用特定的協(xié)議頭打包來傳輸數(shù)據(jù)),以保證數(shù)據(jù)能夠正確無誤的到達(dá)目的地,被終端主機(jī)理解及處理。
四、網(wǎng)絡(luò)故障故障樹的建造
網(wǎng)絡(luò)故障模式多種多樣,發(fā)生故障的原因復(fù)雜,一個(gè)簡(jiǎn)單的故障模式就可能對(duì)應(yīng)兩條甚至多條原因,不同的故障模式下的原因也有可能部分相同;一個(gè)故障模式的發(fā)生還可能會(huì)導(dǎo)致其它故障模式的發(fā)生,關(guān)系的交織和相互影響,就使分析十分困難。在建造故障樹過程中我們基于OSI參考模型來建造故障樹網(wǎng)絡(luò)故障主樹如圖所示;物理層故障主樹、數(shù)據(jù)鏈路層故障主樹、網(wǎng)絡(luò)層故障主樹、傳輸層故障主樹、應(yīng)用層(應(yīng)用層、表示層、會(huì)話層)故障主樹。
實(shí)際當(dāng)中我們要了解的是設(shè)備發(fā)生了哪種故障,是從在線監(jiān)測(cè)的數(shù)據(jù)和故障征兆來判斷的。所以在了解故障樹和故障模式分析所形成的關(guān)于網(wǎng)絡(luò)故障機(jī)理和故障診斷實(shí)踐的經(jīng)驗(yàn)知識(shí)基礎(chǔ)上,我們就要來研究分析來判斷故障模式,形成分析報(bào)告。實(shí)際分析過程中,系統(tǒng)會(huì)依據(jù)規(guī)則知識(shí),結(jié)合網(wǎng)絡(luò)的結(jié)構(gòu)、運(yùn)行、維護(hù)等具體情況,對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行故障判斷。
故障分析系統(tǒng)可以使計(jì)算機(jī)軟件系統(tǒng)能夠運(yùn)用知識(shí)和事實(shí)以及推理機(jī)制去解決通常需要人類專家才能解決的復(fù)雜的問題。故障分析就是這樣一個(gè)整體判斷的完整的復(fù)雜系統(tǒng)。
五、分析系統(tǒng)的結(jié)構(gòu)
故障分析系統(tǒng)工作原理如圖所示。故障分析系統(tǒng)以用戶提供的事實(shí)為基礎(chǔ),根據(jù)系統(tǒng)的故障樹知識(shí)庫,利用一定的推理方法進(jìn)行推理判斷,最后輸出結(jié)果。從結(jié)構(gòu)上講主要是由故障樹知識(shí)庫和推理機(jī)所組成。
故障分析系統(tǒng)的功能是根據(jù)一定的推理策略從知識(shí)庫中選擇有關(guān)知識(shí),對(duì)有關(guān)的證據(jù)進(jìn)行推理,直到得出相應(yīng)的結(jié)論為止。網(wǎng)絡(luò)設(shè)備故障分析系統(tǒng)推理策略主要包含正向推理和反向推理兩種方法:
基于數(shù)據(jù)的正向推理是:從己知的關(guān)于被診斷設(shè)備事實(shí)(主要指異常現(xiàn)象和試驗(yàn)數(shù)據(jù))出發(fā),不斷匹配規(guī)則前提,直到得出關(guān)于故障模式的所有結(jié)論。
基于目標(biāo)的反向推理:從故障模式的假設(shè)出發(fā),不斷地反向應(yīng)用診斷知識(shí)進(jìn)行規(guī)則前提的假設(shè)驗(yàn)證,當(dāng)假設(shè)沒有可用的規(guī)則時(shí),推理機(jī)主動(dòng)向用戶詢問。
反向推理目的性強(qiáng),要求用戶參與,但由于推理進(jìn)程中假設(shè)多,因而推理搜索過程長(zhǎng)且比較盲目。
參考文獻(xiàn):
[1]比奇洛,孫遠(yuǎn)運(yùn)等.計(jì)算機(jī)網(wǎng)絡(luò)故障排除與維護(hù)實(shí)用大全[M].北京:中國(guó)鐵道出版社,2006
【關(guān)鍵詞】網(wǎng)絡(luò)故障 物理故障邏輯故障 維修方法
【中圖分類號(hào)】TP393.01 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1672-5158(2013)04-0169-01
研究背景
計(jì)算機(jī)網(wǎng)絡(luò)是由計(jì)算機(jī)各種軟硬件和通信相關(guān)設(shè)備組成的系統(tǒng),即利用各種通信手段,把空間上分散的計(jì)算機(jī)連在一起,達(dá)到相互通信而且共享軟件、硬件和數(shù)據(jù)等資源的系統(tǒng)。隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,人們的生活得到了巨大的便利,但計(jì)算機(jī)網(wǎng)絡(luò)的連接多樣性、終端分布不均勻性和網(wǎng)絡(luò)的開放性、互連性等特征,網(wǎng)絡(luò)故障也越來越多,目前在各單位的網(wǎng)絡(luò)中都存儲(chǔ)著大量的信息資料,幾乎所有是工作也依賴于網(wǎng)絡(luò),一旦網(wǎng)絡(luò)被破壞造成信息的丟失將帶來巨大損失。加強(qiáng)因此怎樣解決網(wǎng)絡(luò)故障是我們要面對(duì)和解決的重要問題,本文就是通過計(jì)算機(jī)網(wǎng)絡(luò)故障進(jìn)行分析并提出相應(yīng)的對(duì)策,最后達(dá)到更好的運(yùn)用計(jì)算機(jī)網(wǎng)絡(luò)的目的。
常見網(wǎng)絡(luò)故障
連通故障
連通故障又可以稱為物理故障一般,即物理層中物理設(shè)備相互連接失敗或者硬件及線路本身的問題:一是線路的連接故障,由于網(wǎng)線在使用過程中的損壞老化,或者接口處的松動(dòng)等造成的網(wǎng)絡(luò)連接故障。二是由于接口配置問題的物理故障,即由于接口的松動(dòng)或者其他因素的損壞,使網(wǎng)線無法正常接入以及此類相關(guān)設(shè)備損壞導(dǎo)致故障。三是網(wǎng)卡的物理故障,主要是指由于網(wǎng)卡松動(dòng),使網(wǎng)絡(luò)連接失效。
邏輯故障的種類
計(jì)算機(jī)網(wǎng)絡(luò)的邏輯故障又稱軟件故障,主要是指軟件安裝或網(wǎng)絡(luò)設(shè)備配置錯(cuò)誤所引起的網(wǎng)絡(luò)異常,其中最常見的是網(wǎng)絡(luò)設(shè)備配置錯(cuò)誤。邏輯故障與連接故障相比復(fù)雜得多。常見的網(wǎng)絡(luò)邏輯故障有:主機(jī)邏輯故障、進(jìn)程或端口故障、路由器邏輯故障等。主機(jī)邏輯故障通常包括網(wǎng)卡驅(qū)動(dòng)程序、網(wǎng)絡(luò)通信協(xié)議安裝錯(cuò)誤、網(wǎng)絡(luò)地址參數(shù)配置不正確等。進(jìn)程或端口故障是指進(jìn)程或端口由于受到病毒或系統(tǒng)的影響而無法啟動(dòng)。路由器邏輯故障是指因?yàn)槎丝诘呐渲缅e(cuò)誤而導(dǎo)致的網(wǎng)絡(luò)故障,如路由器CPU利用率高和路由器內(nèi)存余量太小以及SNMP進(jìn)程意外關(guān)閉而造成的故障。另外網(wǎng)絡(luò)地址的安全問題,也是計(jì)算機(jī)網(wǎng)絡(luò)故障之一。網(wǎng)絡(luò)用的TCP/IP協(xié)議本身就是一種安全風(fēng)險(xiǎn),大量重要程序都以TCP為傳輸層協(xié)議,因此TCP的安全性問題會(huì)給網(wǎng)絡(luò)帶來嚴(yán)重的后果。四是網(wǎng)絡(luò)結(jié)構(gòu)的安全問題。互聯(lián)網(wǎng)由無數(shù)個(gè)局域網(wǎng)組成,通常情況下計(jì)算機(jī)之間互相傳送的數(shù)據(jù)流要經(jīng)過重重轉(zhuǎn)發(fā),因此,攻擊者只要接入任一節(jié)點(diǎn)就可以捕獲所有數(shù)據(jù)包從而竊取關(guān)鍵信息。
計(jì)算機(jī)網(wǎng)絡(luò)安全的相關(guān)技術(shù)
雖然計(jì)算機(jī)網(wǎng)絡(luò)面臨著諸多的安全問題,但是目前已有比較成熟的網(wǎng)絡(luò)安全技術(shù),包括防病毒軟件、防火墻、入侵檢測(cè)、安全掃描等多個(gè)安全組件組成,主要有防火墻技術(shù)、數(shù)據(jù)加密技術(shù)、入侵檢測(cè)技術(shù)、防病毒技術(shù)等。
防火墻技術(shù):
“防火墻”既可以阻止外界對(duì)內(nèi)部網(wǎng)絡(luò)資源的非法訪問同時(shí)也可以防止系統(tǒng)內(nèi)部對(duì)外部系統(tǒng)的不安全訪問,其主要技術(shù)包括:數(shù)據(jù)包過濾、應(yīng)用級(jí)網(wǎng)關(guān)、服務(wù)和地址轉(zhuǎn)換。
數(shù)據(jù)加密技術(shù):
加密的目的是保護(hù)網(wǎng)絡(luò)節(jié)點(diǎn)之間的鏈路信息安全,可以進(jìn)行數(shù)據(jù)加密、身份鑒別、訪問控制、數(shù)字簽名、數(shù)據(jù)完整性驗(yàn)證、版權(quán)保護(hù)等,用戶可根據(jù)網(wǎng)絡(luò)情況選擇對(duì)稱密鑰密碼體制和非對(duì)稱密鑰密碼技術(shù)等不同的加密方式。信息加密過程操作簡(jiǎn)單,但是意義重大,在多數(shù)情況下,信息加密是保證信息機(jī)密性的唯一方法。
入侵檢測(cè)技術(shù):
分別基于網(wǎng)絡(luò)和基于主機(jī)。由于網(wǎng)絡(luò)的入侵檢測(cè)系統(tǒng)主要采用被動(dòng)方法收集網(wǎng)絡(luò)上的數(shù)據(jù)。目前,在實(shí)際環(huán)境中應(yīng)用較多的是基于主機(jī)的入侵檢測(cè)系統(tǒng),它可以不受網(wǎng)絡(luò)協(xié)議、速率和加密的影響直接針對(duì)主機(jī)和內(nèi)部的信息系統(tǒng)同時(shí)還具有檢查木馬等功能。
防病毒技術(shù):
網(wǎng)絡(luò)防病毒軟件則主要注重網(wǎng)絡(luò)防病毒。嘗試?yán)?60安全衛(wèi)士等具有殺毒和軟件修復(fù)功能的瀏覽器或Firefox瀏覽器,可以清除病毒,防止病毒軟件對(duì)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的破壞。
安全對(duì)策以及維護(hù)方法
對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的維護(hù)包括對(duì)硬件的維護(hù)和對(duì)軟件的維護(hù)。對(duì)硬件的維護(hù)包括檢測(cè)聯(lián)網(wǎng)電腦網(wǎng)卡、網(wǎng)線、集線器、交換機(jī)、路由器等故障、計(jì)算機(jī)硬盤、內(nèi)存、顯示器的維護(hù)。首先要仔細(xì)檢查計(jì)算機(jī)網(wǎng)卡是否運(yùn)行正常,檢查網(wǎng)線以及網(wǎng)卡指示燈,如果出現(xiàn)故障,應(yīng)及時(shí)更換網(wǎng)線,集成器等部件。檢查網(wǎng)絡(luò)插口股,在網(wǎng)絡(luò)連接過程中,會(huì)因?yàn)槲锲窋D壓以及不小心造成的損壞,以及接口處的松動(dòng),而導(dǎo)致計(jì)算機(jī)無法聯(lián)網(wǎng),此時(shí)應(yīng)對(duì)計(jì)算機(jī)與插口間的電纜線進(jìn)行檢查。利用測(cè)線儀等工具測(cè)試網(wǎng)線、接口、網(wǎng)卡以及交換機(jī)端口是否正常。對(duì)由于路由器配置錯(cuò)誤會(huì)導(dǎo)致的故障,方法就是重新配置路由器端口的靜態(tài)路。如果是由,只有對(duì)路由器進(jìn)行升級(jí)、擴(kuò)大內(nèi)存。
對(duì)計(jì)算機(jī)軟件的維護(hù)包括計(jì)算機(jī)網(wǎng)絡(luò)設(shè)置的維護(hù),對(duì)網(wǎng)絡(luò)安全l生的檢測(cè),以及對(duì)網(wǎng)絡(luò)通暢性的檢測(cè)。多為瀏覽器本身故障或被惡意軟件篡改破壞,導(dǎo)致無法瀏覽網(wǎng)頁,對(duì)網(wǎng)絡(luò)設(shè)置的維護(hù)。首先,檢查Ping線路近端的端口是否處于關(guān)閉的狀態(tài),若是因?yàn)槎丝谔幱陉P(guān)閉狀態(tài),只需重新啟動(dòng)該端口即可。檢查lP地址,TCP/IP選項(xiàng)參數(shù)是否正確,當(dāng)所填參數(shù)有誤時(shí),可以通過lP地址,TCP/IP選項(xiàng)參數(shù)進(jìn)行修改核對(duì)。對(duì)網(wǎng)絡(luò)安全性的維護(hù)包括安裝殺毒軟件,經(jīng)常性的進(jìn)行查殺毒處理,安裝的防火墻,設(shè)置高密的防治網(wǎng)絡(luò)安全入侵的加密處理,定期的對(duì)網(wǎng)絡(luò)加密設(shè)置進(jìn)行更新。例如及時(shí)查殺病毒并,避免使用非正規(guī)的磁盤,不要打開垃圾郵件,不要隨意點(diǎn)擊非法網(wǎng)站。
關(guān)鍵詞:氣象業(yè)務(wù);網(wǎng)絡(luò);故障診斷;故障排除
隨著越來越多的先進(jìn)技術(shù)和服務(wù)引入到氣象業(yè)務(wù)網(wǎng)絡(luò)中,網(wǎng)絡(luò)管理和維護(hù)工作變得越來越復(fù)雜。局域網(wǎng)在氣象系統(tǒng)廣泛應(yīng)用中,常遇到各種故障,正式運(yùn)行的網(wǎng)絡(luò)一旦出了問題,需要及時(shí)進(jìn)行檢測(cè)和診斷,盡快定位并排除故障。
下面介紹一下網(wǎng)絡(luò)故障的診斷和排除方法。
一、主要的故障種類
根據(jù)網(wǎng)絡(luò)故障的性質(zhì)把網(wǎng)絡(luò)故障分為物理故障與邏輯故障,也可根據(jù)網(wǎng)絡(luò)故障的對(duì)象把網(wǎng)絡(luò)故障分為路由故障和主機(jī)故障。
1.1物理故障
物理故障即硬件連接故障,指的是設(shè)備或線路損壞、插頭松動(dòng)、線路受到嚴(yán)重電磁干擾等情況。網(wǎng)卡沒有連接到主板上,網(wǎng)卡的電源燈和數(shù)據(jù)燈都不亮,設(shè)備管理器中檢測(cè)不到網(wǎng)卡。網(wǎng)線沒有連接好,網(wǎng)卡已經(jīng)驅(qū)動(dòng),協(xié)議也添加,但仍然不能上網(wǎng),觀察網(wǎng)卡硬件連接,網(wǎng)卡只有一個(gè)燈亮,不閃爍。
如兩個(gè)路由器Router直接連接,這時(shí)應(yīng)該讓一臺(tái)路由器的出口連接另一臺(tái)路由器的入口,而這臺(tái)路由器的入口連接另一路由器的出口才行。當(dāng)然,集線器C6D、交換機(jī)、多路復(fù)用器也必須連接正確,否則也會(huì)導(dǎo)致網(wǎng)絡(luò)中斷。還有一些網(wǎng)絡(luò)連接故障比較隱蔽,要診斷它只有靠經(jīng)驗(yàn)。
1.2邏輯故障
邏輯故障中最常見的情況就是配置錯(cuò)誤,指因?yàn)榫W(wǎng)絡(luò)設(shè)備的配置原因而導(dǎo)致的網(wǎng)絡(luò)異常或故障。配置錯(cuò)誤可能是路由器端口參數(shù)設(shè)定有誤,或路由器路由配置錯(cuò)誤以至于路由循環(huán)或找不到遠(yuǎn)端地址,或者是路由掩碼設(shè)置錯(cuò)誤等。邏輯故障的另一類就是一些重要進(jìn)程或端口關(guān)閉及系統(tǒng)的負(fù)載過高。如線路中斷,沒有流量,用ping發(fā)現(xiàn)線路端口不通,檢查發(fā)現(xiàn)該端口處于down的狀態(tài),說明該端口已經(jīng)關(guān)閉,導(dǎo)致故障。
1.3路由器故障
線路故障中很多情況都涉及到路由器,也可以把一些線路故障歸結(jié)為路由器故障。檢測(cè)這種故障,需要利用MIB變量瀏覽器,用它收集路由器的路由表、端口流量數(shù)據(jù)、計(jì)費(fèi)數(shù)據(jù)、路由器CPU的溫度、負(fù)載以及路由器的內(nèi)存余量等數(shù)據(jù),通常情況下網(wǎng)絡(luò)管理系統(tǒng)有專門的管理進(jìn)程,不斷地檢測(cè)路由器的關(guān)鍵數(shù)據(jù),并及時(shí)給出報(bào)警。
1.4主機(jī)故障
主機(jī)故障常見的現(xiàn)象就是主機(jī)的配置不當(dāng)。如主機(jī)配置的IP地址與其它主機(jī)沖突,或IP地址根本就不在子網(wǎng)范圍內(nèi),由此導(dǎo)致主機(jī)無法連通。主機(jī)的另一故障就是安全故障。主機(jī)沒有控制其上的finger、RPC、rlogin等多余服務(wù)。而攻擊者可以通過這些多余進(jìn)程的正常服務(wù)或bug攻擊該主機(jī),甚至得到Administractor的權(quán)限等。
二、故障的檢測(cè)和診斷
大多計(jì)算機(jī)用Windows操作系統(tǒng),Windows提供了一些命令行檢測(cè)工具,這些工具是網(wǎng)絡(luò)診斷中常用的,而且一般的問題大都可以通過這些命令診斷出來。如果對(duì)這些命令很熟悉,在網(wǎng)絡(luò)出故障時(shí)就會(huì)運(yùn)用自如。
2.1用連接故障診斷工具Ping網(wǎng)絡(luò)診斷
輸入命令:ping172.18.82.201(172.18.82.201為本機(jī)地址),顯示:Pinging172.18.82.201with32bytesofdata:Replyfrom172.18.82.201:bytes=32time=10msTTL=128有"time="的內(nèi)容,表明可以ping通,網(wǎng)絡(luò)協(xié)議TCP/IP協(xié)議正常。執(zhí)行ping命令后得到信息:Pinging172.18.82.201with32bytesofdata:Requesttimedout.表示不可以ping通,或者是tcp/ip協(xié)議可能有問題,或者是計(jì)算機(jī)到交換機(jī)間的硬件連接存在問題。
測(cè)試數(shù)據(jù)傳輸丟包,輸入Pingstatisticsfor172.18.72.56,顯示:Packets:Sent=4,Received=2,Lost=2(50%loss),Approximateroundtriptimesinmilli-seconds:Minimum=177ms,Maximum=182ms,Average=89ms信息表示發(fā)送了4個(gè)數(shù)據(jù)包,回送收到2個(gè),丟失2個(gè),丟失率為50%。發(fā)送數(shù)據(jù)包最快回送時(shí)間177ms,最慢回送時(shí)間182ms,平均89ms。如可以ping通自己,也可以ping通鄰居或能看到其他機(jī)器,表明本地設(shè)置正確。網(wǎng)關(guān)可以通過軟件實(shí)現(xiàn)協(xié)議轉(zhuǎn)換操作,能起到與硬件類似的作用。ping網(wǎng)關(guān)地址,例如ping172.18.82.17-t,就可以查看與網(wǎng)關(guān)是否連通。
2.2pathping命令
pathping用于跟蹤數(shù)據(jù)包到達(dá)目標(biāo)所采取的路由,并顯示路徑中每個(gè)路由器的數(shù)據(jù)包損失信息,也可以用于解決服務(wù)質(zhì)量連通性問題。是一個(gè)比tracert更為有用的工具。它將ping和tracert命令的功能和這2個(gè)工具所不提供的其他信息結(jié)合起來。由于該命令顯示數(shù)據(jù)包在任何給定路由器或鏈路上丟失的程度,因此可以很容易地確定可能導(dǎo)致網(wǎng)絡(luò)問題的路由或鏈路。不過WIN9X/Me、WindowsNT不提供此命令。命令格式是:pathpingtargetname,比如c:\>pathping172·19·3·1,
Computingstatisticsfor75seconds···
SourcetoHereThisNode/Link
HopRTTLost/Sent=PctLost/Sent=PctAddress
0jishu-sun[172·19·1·242]0/100=0%|
10ms0/100=0%0/100=0%172·19·1·20/100=0%|
25ms1/100=0%1/100=0%172·19·6·20/100=0%|
34ms0/100=0%0/100=0%172·19·3·1
Tracecomplete·
可以看出,它先提供給我們查看路由的結(jié)果,然后等待75s(此時(shí)間根據(jù)躍點(diǎn)數(shù)變化)最后顯示測(cè)試結(jié)果。第3列是源到當(dāng)前的丟包數(shù)。第4列是指明線路和路由器丟包情況,最右邊的欄中標(biāo)記為"|",表明沿線路轉(zhuǎn)發(fā)丟失的數(shù)據(jù)包,該丟失表明鏈阻塞;最右邊欄中為IP地址的,表明該路由器的丟失率,可能是由于路由器CPU超負(fù)荷所致。如果某一處丟包嚴(yán)重,則應(yīng)采取必要的措失,以提高通信質(zhì)量。
三、故障排除的解決方案
不系統(tǒng)的故障診斷與排除方法將導(dǎo)致在網(wǎng)絡(luò)故障現(xiàn)象相互依賴和偶然性的迷宮中浪費(fèi)時(shí)間。系統(tǒng)的網(wǎng)絡(luò)故障排除方法的總體思路是系統(tǒng)地將產(chǎn)生故障可能的原因所構(gòu)成的1個(gè)大集合縮減成1個(gè)小的子集或者直接確定故障起因。
3.1網(wǎng)絡(luò)適配卡中斷與其他硬件資源沖突
在"系統(tǒng)"的"設(shè)備管理器"查找旁邊出現(xiàn)感嘆號(hào)的有黃圈的網(wǎng)絡(luò)適配器項(xiàng)目,找到項(xiàng)目網(wǎng)絡(luò)適配器可能與其它設(shè)備使用同樣的資源設(shè)置。雙擊網(wǎng)絡(luò)適配器項(xiàng)目,在網(wǎng)絡(luò)適配器"資源"中更改網(wǎng)絡(luò)適配器的中斷和I/O地址,避免與其它硬件沖突。用即插即用的網(wǎng)絡(luò)適配卡,可使用制造商提供的安裝盤將即插即用型改為跳線型,設(shè)置網(wǎng)絡(luò)適配卡的中斷和I/O地址。
3.2在"網(wǎng)上鄰居"中沒有顯示網(wǎng)絡(luò)中的其它計(jì)算機(jī)
打開"網(wǎng)上鄰居"時(shí),將顯示你的計(jì)算機(jī),如果計(jì)算機(jī)所在的工作組設(shè)置不正確,打開"網(wǎng)上鄰居"時(shí)看不到所需的計(jì)算機(jī)。在"網(wǎng)絡(luò)"的"標(biāo)識(shí)"更改工作組的設(shè)置。
確認(rèn)計(jì)算機(jī)是否安裝了必要的網(wǎng)絡(luò)組件,如果沒有安裝正確的網(wǎng)絡(luò)客戶、適配器和協(xié)議組件,將不能與網(wǎng)絡(luò)通信。在"網(wǎng)絡(luò)"的"配置"中可看已安裝的網(wǎng)絡(luò)組件。確認(rèn)所安裝的網(wǎng)絡(luò)客戶軟件和協(xié)議是否適合所連接的網(wǎng)絡(luò)。局域網(wǎng)中盡量采用TCP/IP和NETBEUI協(xié)議,或者只用NETBEUI協(xié)議。
參考文獻(xiàn)
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的普及和發(fā)展,給人們的生存方式帶來了巨大的變革。人們通過計(jì)算機(jī)網(wǎng)絡(luò)獲取資源、交換信息已經(jīng)成為一種常態(tài),但在網(wǎng)絡(luò)的使用過程中難免會(huì)存在各種問題,對(duì)人們的學(xué)習(xí)、工作和生活造成不便,甚至影響到關(guān)鍵數(shù)據(jù)和經(jīng)濟(jì)財(cái)產(chǎn)的安全。因此,了解計(jì)算機(jī)網(wǎng)絡(luò)的常見故障和處理方法尤為重要。
1 計(jì)算機(jī)網(wǎng)絡(luò)的故障類型
計(jì)算機(jī)網(wǎng)絡(luò)故障一般可分為物理故障和邏輯故障兩類。
物理故障是指由于硬件原因引起的網(wǎng)絡(luò)故障,常常表現(xiàn)為本地連接斷開、網(wǎng)絡(luò)時(shí)斷時(shí)續(xù)等。常見的物理故障包括網(wǎng)線損壞、路由器和交換機(jī)故障、網(wǎng)卡損壞、元件接觸不良等。
邏輯故障通常表現(xiàn)為本地連接受限、網(wǎng)絡(luò)不穩(wěn)定、瀏覽器顯示異常等。邏輯故障主要由計(jì)算機(jī)網(wǎng)絡(luò)參數(shù)錯(cuò)誤、網(wǎng)卡驅(qū)動(dòng)不兼容、路由器配置不合理和病毒入侵等原因造成。
2 計(jì)算機(jī)網(wǎng)絡(luò)故障的診斷方法
計(jì)算機(jī)網(wǎng)絡(luò)故障具有多變性和復(fù)雜性,涉及網(wǎng)線、網(wǎng)卡、路由器、病毒等多方面原因,當(dāng)計(jì)算機(jī)網(wǎng)絡(luò)發(fā)生故障時(shí),我們可以根據(jù)經(jīng)驗(yàn)初步判斷故障類型,逐層排查,最終確定故障所在。計(jì)算機(jī)網(wǎng)絡(luò)故障的診斷應(yīng)從三個(gè)方面入手。[1]
1)先檢查可直接觀察和判斷情況的外部設(shè)備,如網(wǎng)線是否損壞、路由器指示燈是否正常等,再考慮設(shè)備內(nèi)部的軟硬件問題。
2)先檢查是否為本地計(jì)算機(jī)的網(wǎng)絡(luò)故障,如病毒入侵、驅(qū)動(dòng)程序損壞、網(wǎng)卡松動(dòng)等,再考慮網(wǎng)絡(luò)鏈路、路由器、交換機(jī)的故障。
3)先檢查計(jì)算機(jī)、路由器的網(wǎng)絡(luò)參數(shù)配置,如果沒有問題,再考慮設(shè)備的硬件故障。
3 常見故障的分析和處理方法
3.1 物理故障
1)線路連接問題
線路連接問題是硬件故障中最常見的一種,占所有網(wǎng)絡(luò)故障的70%以上。[2]常見的線路故障包含接口松動(dòng)、線路損壞和電磁干擾三類,例如路由器或交換機(jī)的電源插頭未通電、RJ45水晶頭損壞或松動(dòng)、網(wǎng)線因擠壓和拉扯而損壞、周邊有較強(qiáng)電磁波干擾等。線路連接的檢測(cè)可通過替換排除法和專業(yè)儀器測(cè)試的方式進(jìn)行。對(duì)于水晶頭和線路損壞等問題,可通過更換來解決;對(duì)于電磁干擾問題,則可選用屏蔽強(qiáng)度較高的網(wǎng)線。
2)路由器和交換機(jī)故障
路由器和交換機(jī)是計(jì)算機(jī)網(wǎng)絡(luò)中路由轉(zhuǎn)發(fā)和數(shù)據(jù)交換的核心設(shè)備,是局域網(wǎng)內(nèi)設(shè)備能否連通廣域網(wǎng)的關(guān)鍵。路由器和交換機(jī)故障主要是指物理損壞,造成設(shè)備不能通電、端口故障等問題,可通過信號(hào)燈的狀態(tài)和替換排除法進(jìn)行判斷。
信號(hào)燈的狀態(tài)直接反映了路由器和交換機(jī)的工作狀態(tài),如系統(tǒng)運(yùn)行和端口連通是否正常。在使用替換排除法時(shí),可將網(wǎng)線逐個(gè)連接到路由器和交換的端口進(jìn)行檢測(cè),如果部分端口連通正常,則可判定為設(shè)備的端口故障;如果所有端口均不能連通,則可判定為零部件發(fā)生故障。如果路由器不能加電而電源線連通正常,則考慮是路由器的電源問題。
3)計(jì)算機(jī)網(wǎng)卡問題
計(jì)算機(jī)網(wǎng)卡發(fā)生故障,也將導(dǎo)致網(wǎng)絡(luò)連接出現(xiàn)問題,常見的故障包括網(wǎng)卡松動(dòng)、網(wǎng)卡金手指氧化、網(wǎng)卡硬件故障、卡槽損壞等。網(wǎng)卡的故障檢測(cè)分為兩個(gè)步驟進(jìn)行:(拔出網(wǎng)卡,仔細(xì)清理卡槽內(nèi)的灰塵,用橡皮擦小心擦拭網(wǎng)卡金手指,之后重新插入卡槽,如果恢復(fù)正常則認(rèn)定為網(wǎng)卡松動(dòng)和金手指氧化所引起的接觸不良。(如步驟一無法恢復(fù)正常,可將正常使用的網(wǎng)卡更換到故障計(jì)算機(jī)中,如果問題得以解決則說明是網(wǎng)卡硬件故障,更換網(wǎng)卡即可,否則就可能是網(wǎng)卡的插槽損壞。
3.2 邏輯故障
1)路由器參數(shù)配置問題
路由器在購買和安裝之后通常需要進(jìn)行參數(shù)配置,包括網(wǎng)絡(luò)參數(shù)、DHCP、安全管理等設(shè)置,如果參數(shù)配置錯(cuò)誤,則會(huì)引起網(wǎng)絡(luò)連接不上、經(jīng)常掉線等問題。路由器的參數(shù)配置首先是WAN口的配置,需要根據(jù)具體的網(wǎng)絡(luò)環(huán)境設(shè)置WAN口的連接類型和連接模式,例如靜態(tài)IP還是PPPOE撥號(hào)、是自動(dòng)連接還是定時(shí)連接等。
在一些大型的局域網(wǎng)環(huán)境中,難以做到給每一臺(tái)計(jì)算機(jī)進(jìn)行參數(shù)分配,為了避免IP地址沖突和提高使用運(yùn)行效率,還需進(jìn)行DHCP服務(wù)器的配置,如果參數(shù)配置出現(xiàn)問題,則會(huì)影響整個(gè)局域網(wǎng)的連接。此外,有些路由器還進(jìn)行了安全管理設(shè)置,如訪問限制、防火墻和遠(yuǎn)程web端口的設(shè)置等,都影響了用戶的網(wǎng)絡(luò)連接。
2)計(jì)算機(jī)網(wǎng)絡(luò)配置問題
計(jì)算機(jī)的網(wǎng)絡(luò)配置主要是指通信協(xié)議(TCP/IP)的配置,通信協(xié)議被破壞或遭到篡改都會(huì)導(dǎo)致網(wǎng)絡(luò)連接故障。當(dāng)計(jì)算機(jī)出現(xiàn)網(wǎng)絡(luò)連接受限等提示時(shí),應(yīng)首先檢查TCP/IP的設(shè)置是否正確,如是否設(shè)置了靜態(tài)IP和DNS服務(wù)器的地址,以及IP地址是否和路由器在同一個(gè)網(wǎng)段等。如果網(wǎng)絡(luò)連接正常,QQ能正常使用但不能訪問瀏覽器網(wǎng)頁時(shí),則往往是DNS的配置出現(xiàn)錯(cuò)誤,一般來說,重新設(shè)置DNS服務(wù)器的地址即可解決問題。
3)計(jì)算機(jī)網(wǎng)卡驅(qū)動(dòng)程序問題
計(jì)算機(jī)網(wǎng)卡驅(qū)動(dòng)程序的問題一般分為兩種:驅(qū)動(dòng)程序未安裝或被卸載、驅(qū)動(dòng)程序與網(wǎng)卡不兼容。使用者由于誤操作而刪除驅(qū)動(dòng)程序和相關(guān)文件的事情時(shí)有發(fā)生,造成網(wǎng)絡(luò)連接錯(cuò)誤或找不到本地連接等問題,可打開設(shè)備管理器,查看網(wǎng)絡(luò)適配器的運(yùn)行狀態(tài),如果有黃色問號(hào)或運(yùn)行不正常等提示,則卸載驅(qū)動(dòng)程序重新進(jìn)行安裝。
網(wǎng)卡驅(qū)動(dòng)程序不兼容的問題常常出現(xiàn)在重裝電腦的過程中,造成驅(qū)動(dòng)程序無法安裝或網(wǎng)絡(luò)連接故障等,可對(duì)驅(qū)動(dòng)程序進(jìn)行升級(jí),或下載官方驅(qū)動(dòng)程序重新安裝,一般可解決問題。
4)網(wǎng)絡(luò)病毒攻擊和黑客入侵問題
網(wǎng)絡(luò)病毒攻擊和黑客入侵波及范圍大、危害程度高,是最常見網(wǎng)絡(luò)故障誘因之一,可造成計(jì)算機(jī)網(wǎng)絡(luò)訪問異常、整個(gè)局域網(wǎng)運(yùn)行緩慢、核心設(shè)備參數(shù)被篡改、關(guān)鍵數(shù)據(jù)被盜取等種種問題,嚴(yán)重的可引起整個(gè)網(wǎng)絡(luò)癱瘓、造成經(jīng)濟(jì)損失和威脅人身安全,是計(jì)算機(jī)網(wǎng)絡(luò)安全防護(hù)的重中之重。一旦出現(xiàn)網(wǎng)絡(luò)連接異常和安全信息提示時(shí),應(yīng)立即進(jìn)行漏洞修復(fù)、病毒掃描等相關(guān)處理。此外,路由器、防火墻等核心網(wǎng)絡(luò)設(shè)備的管理賬號(hào)和口令應(yīng)具備較高的復(fù)雜性,以提高網(wǎng)絡(luò)安全防護(hù)性能。
4 計(jì)算機(jī)網(wǎng)絡(luò)的維護(hù)
為了減少網(wǎng)絡(luò)故障的發(fā)生、提高網(wǎng)絡(luò)運(yùn)行的效率和安全性,在使用過程中,我們還需對(duì)計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行合理的維護(hù),主要包括以下幾方面。
1)定期檢查設(shè)備的運(yùn)行情況
定期檢查計(jì)算機(jī)、路由器、交換機(jī)等設(shè)備的運(yùn)行情況,對(duì)出現(xiàn)故障的設(shè)備進(jìn)行及時(shí)的維修和更換,避免因設(shè)備的突然損壞造成不必要的損失;同時(shí)應(yīng)對(duì)軟件系統(tǒng)進(jìn)行維護(hù)和更新,及時(shí)修復(fù)系統(tǒng)漏洞、安裝系統(tǒng)更新、升級(jí)安全防護(hù)軟件,保證網(wǎng)絡(luò)的穩(wěn)定運(yùn)
2)加強(qiáng)安全防護(hù)措施
加強(qiáng)路由器的安全性措施,限制系統(tǒng)的物理訪問,禁用不必要的功能和端口,嚴(yán)格管理登錄賬號(hào)和口令,防止病毒攻擊和黑客入侵;[3]還可設(shè)置一定的網(wǎng)絡(luò)訪問限制,規(guī)定哪些網(wǎng)站用戶不可訪問,避免用戶因誤操作而帶來的安全隱患。
3)保持網(wǎng)絡(luò)機(jī)房的環(huán)境衛(wèi)生
計(jì)算機(jī)、路由器等設(shè)備在使用的過程中,CPU、主板、風(fēng)扇、卡槽等部位容易積累大量的灰塵。灰塵會(huì)影響設(shè)備的散熱性能,造成零部件的接觸不良,加速設(shè)備的老化,而且容易引發(fā)靜電,可能導(dǎo)致元件的損壞。因此,需定期對(duì)設(shè)備進(jìn)行除塵,保持網(wǎng)絡(luò)機(jī)房的環(huán)境衛(wèi)生。
5 結(jié)束語
隨著科學(xué)技術(shù)的發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)已經(jīng)成為人們生活的重要組成部分,了解計(jì)算機(jī)網(wǎng)絡(luò)的常見故障和處理方法,重視計(jì)算機(jī)網(wǎng)絡(luò)的日常維護(hù),才能使我們做到在故障發(fā)生前積極防范、在故障發(fā)生后迅速補(bǔ)救,使網(wǎng)絡(luò)的運(yùn)行更穩(wěn)定、更高效、更安全。
“邯鄲學(xué)步”也好,“照貓畫虎”也罷,總之,一遇到網(wǎng)絡(luò)故障,就按照這些思路來辦吧!
一位網(wǎng)管的牢騷
現(xiàn)在的網(wǎng)吧客人,開機(jī)不會(huì),輸入法切換不會(huì),字母大小寫轉(zhuǎn)換不會(huì),玩私服登錄器怎么用不會(huì),QQ開語音不會(huì),進(jìn)了游戲不會(huì)退出,私服服務(wù)器關(guān)了說我機(jī)子有問題。語音聊天不會(huì)開MIC,說網(wǎng)吧耳機(jī)是壞的,看電影嫌不是普通話的!QQ登錄不上說機(jī)器不好,我跑過去一看,密碼不對(duì),他還問我密碼多少!!
打個(gè)CS別人放顆煙霧彈,他遭閃了,狂喊:網(wǎng)管死機(jī)了……今天有客人還問我,網(wǎng)管我這里怎么沒有QQ幣呢,你幫我下載點(diǎn)QQ幣……我%#%##,那玩意要是能下載,我TMD就不用上班了~
小提示:如何具體對(duì)某層進(jìn)行排查?
網(wǎng)絡(luò)故障在OSI模型的每一層,都有相應(yīng)的檢測(cè)排查工具或措施:物理層,使用專門的線纜測(cè)試儀;數(shù)據(jù)鏈路層,使用簡(jiǎn)ARP命令來檢查MAC地址和IP地址之間的對(duì)應(yīng)關(guān)系;網(wǎng)絡(luò)層,除使用ping命令測(cè)試連通性和route命令查看路由配置外,還需要使用網(wǎng)絡(luò)檢測(cè)分析軟件對(duì)網(wǎng)絡(luò)層和傳輸層的數(shù)據(jù)通信進(jìn)行檢測(cè)分析;應(yīng)用層,檢測(cè)應(yīng)用程序配置是否正確,對(duì)應(yīng)用程序自身進(jìn)行測(cè)試。
總原則:OSI模型與網(wǎng)絡(luò)故障的排除
做網(wǎng)管的,相比對(duì)“OSI”這個(gè)概念或多或少都有了解吧。為了降低設(shè)計(jì)的復(fù)雜性,增強(qiáng)通用性和兼容性,所有的計(jì)算機(jī)網(wǎng)絡(luò)都設(shè)計(jì)成層次結(jié)構(gòu),并且是統(tǒng)一的――這種層次結(jié)構(gòu)就是OSI。
1.通過OSI模型來排查問題
那么,這個(gè)OSI模型與解決網(wǎng)絡(luò)故障有什么關(guān)系呢?實(shí)際上,一個(gè)很簡(jiǎn)單的道理――既然任何網(wǎng)絡(luò)都是由這7層構(gòu)成的,那么網(wǎng)絡(luò)發(fā)生故障,也就是7層中的某一層,或者某幾層出了問題,所以解決故障,就是解決層的故障了。這么說可能大家有點(diǎn)暈乎乎,我們舉個(gè)例子來講一下吧。
實(shí)例1:某客戶端不能訪問web服務(wù)
我們一般解決這一故障的思路是:首先檢查客戶端Web瀏覽器是否正確配置,可嘗試使用瀏覽器訪問另一個(gè)Web服務(wù)器;如果Web瀏覽器沒有問題,可在Web瀏覽器上測(cè)試Web服務(wù)器是否正常運(yùn)行;如果Web服務(wù)器沒有問題,再測(cè)試網(wǎng)絡(luò)的連通性……
這個(gè)思路是什么意思呢?其實(shí)它就是從OSI模型的“應(yīng)用層”出發(fā),一直到“物理層”(網(wǎng)卡是否損壞?網(wǎng)線是不是斷了?)。
網(wǎng)管在分析和排查網(wǎng)絡(luò)故障時(shí),應(yīng)充分利用網(wǎng)絡(luò)這種分層的特點(diǎn),快速準(zhǔn)確地定位并排除故障,這便是本文要介紹的總體思路。
2.兩種逐層排查方式
對(duì)于這一思路,通常有兩種逐層排查方式:一種是從低層開始排查,適用于物理網(wǎng)絡(luò)不夠成熟穩(wěn)定的情況,如組建新的網(wǎng)絡(luò)、重新調(diào)整網(wǎng)絡(luò)線纜、增加新的網(wǎng)絡(luò)設(shè)備等;另一種是從高層開始排查,適用于物理網(wǎng)絡(luò)相對(duì)成熟穩(wěn)定的情況,如硬件設(shè)備沒有變動(dòng),而軟件曾經(jīng)變動(dòng),比如新裝了TCP/IP協(xié)議、重裝了操作系統(tǒng)和瀏覽器等等。
無論哪種方式,最終都能達(dá)到目標(biāo),只是解決問題的效率會(huì)不同而已。比如實(shí)例1中,如果你顛倒順序,從“物理層”開始排查,那問題最終可以解決,但恐怕得花上一整天,結(jié)果卻發(fā)現(xiàn)――原來是那個(gè)網(wǎng)站出了問題,別的一切正常……
小提示:什么是OSI模型?
OSI,即OpenSystemInterconnection,開放系統(tǒng)互聯(lián)。最早的網(wǎng)絡(luò)剛剛出現(xiàn)的時(shí)候,很多大型公司都擁有網(wǎng)絡(luò)技術(shù),公司內(nèi)部計(jì)算機(jī)可以互相連接,但卻不能和其他公司連接,因?yàn)闆]有一個(gè)統(tǒng)一規(guī)范。ISO正是為此而來,它把網(wǎng)絡(luò)分為物理層、數(shù)據(jù)鏈路層網(wǎng)絡(luò)、網(wǎng)絡(luò)層、傳輸層、會(huì)話層、表示層、應(yīng)用層等7層,其中每一層都有其作用(見圖1)。
圖1
3.不可過于教條
前面介紹的兩種“逐層”排查方式顯得比較古板,實(shí)際操作時(shí),大家記得要靈活運(yùn)用,否則可能浪費(fèi)很多時(shí)間和精力。一種比較通用的方法是――折中法。
第1步 涉及網(wǎng)絡(luò)通信的應(yīng)用出現(xiàn)故障,直接從位于中間的網(wǎng)絡(luò)層開始排查,首先測(cè)試網(wǎng)絡(luò)連通性。具體就是使用ping命令。這也是幾乎所有網(wǎng)絡(luò)故障發(fā)生后,網(wǎng)管第一步要做的就是ping的原因。
第2步 如果網(wǎng)絡(luò)不能連通,再從物理層(測(cè)試線路)開始排查。如果網(wǎng)絡(luò)能夠連通,再從應(yīng)用層(測(cè)試應(yīng)用程序本身)開始排查。
實(shí)例2:網(wǎng)絡(luò)之間不能正常通信
方法1:首先我們要ping遠(yuǎn)程計(jì)算機(jī),成功則說明系統(tǒng)和網(wǎng)絡(luò)正常,失敗后再ping同一子網(wǎng)的網(wǎng)關(guān)來確定是否能連接到路由器。失敗后再ping 127.0.0.1來確認(rèn)TCP/IP協(xié)議是否正常。
方法2:首先ping 127.0.0.1,如果成功則ping同一子網(wǎng)的網(wǎng)關(guān),如果成功則ping其他網(wǎng)關(guān),直到最后ping遠(yuǎn)程主機(jī)。
這兩種排查方法的思路是不一樣的,方法1是從高層到低層,而方法2是從低層到高層。至于具體如何靈活去安排排查的順序,這個(gè)是不一定的,需要大家經(jīng)驗(yàn)的積累,經(jīng)驗(yàn)?zāi)芨嬖V你究竟怎樣效率最高。
習(xí)慣:網(wǎng)絡(luò)故障排除的經(jīng)驗(yàn)
前面我們從技術(shù)的角度來介紹一些排除故障的思路,下面就從人為經(jīng)驗(yàn)方面做些介紹。實(shí)際上,一個(gè)好的習(xí)慣對(duì)故障解決是非常重要的,尤其是長(zhǎng)期需要和“故障”打交道的網(wǎng)管。
第1步 你真的知道“故障”是怎么回事嗎?
在開始排除故障前,準(zhǔn)備好紙和筆,將故障現(xiàn)象記錄下來。在識(shí)別故障的時(shí)候要注意以下幾點(diǎn):
當(dāng)故障發(fā)生的時(shí)候,正在運(yùn)行哪些程序?
這些程序以前是否成功運(yùn)行過?
如果成功運(yùn)行過,最后一次運(yùn)行是在什么時(shí)候?
發(fā)生故障之前對(duì)系統(tǒng)、軟件配置以及硬件設(shè)備配置做了哪些更改?
第2步 列舉可能導(dǎo)致故障產(chǎn)生的所有原因
將所有可能導(dǎo)致這一結(jié)果的情況列出來,記得不要放過任何細(xì)節(jié)、任何可能。比如無法瀏覽網(wǎng)頁時(shí),到底是網(wǎng)卡故障、網(wǎng)絡(luò)連接問題,還是網(wǎng)絡(luò)協(xié)議設(shè)置不當(dāng),或者是IE瀏覽器的參數(shù)設(shè)置有誤,或者干脆是ISP出了問題?
第3步 縮小包圍圈
故障排除的時(shí)候有幾個(gè)原則:
先操作簡(jiǎn)單的,后操作復(fù)雜的:比如ping就很簡(jiǎn)單,而要用測(cè)試儀查查網(wǎng)線是否斷裂就是復(fù)雜的。
先來“軟”的,后來“硬”的:對(duì)軟件設(shè)置問題的解決往往具有回溯性,且容易操作,建議將這部分放在最開始。
從本機(jī)到本地,從本子網(wǎng)到大局域網(wǎng),從局域網(wǎng)到互聯(lián)網(wǎng):范圍由小到大,容易讓問題不那么復(fù)雜。