本文作者: 劉浩然
本文來(lái)源: 與非網(wǎng)eefocus
原文鏈接:https://mp.weixin.qq.com/s/ZYDCKTDDPaHzd5EvK4GdZA
6月8日下午,有大量廣東電信用戶(hù)反饋手機(jī)出現(xiàn)了打不了電話(huà),,上不了網(wǎng)的情況。事發(fā)時(shí)正值高考期間,而且斷連并沒(méi)有在短時(shí)間內(nèi)迅速恢復(fù),,這一消息也迅速被頂上各大平臺(tái)熱搜。
據(jù)悉,,本次受到影響的用戶(hù)并不只是位于廣東的電信用戶(hù),。
據(jù)網(wǎng)友證實(shí),只要你用的是廣東電信卡,,不論人在哪里,,都一定會(huì)出現(xiàn)不能打電話(huà)的情況。根據(jù)2021年廣東電信官方資料顯示,,廣東電信的用戶(hù)總數(shù)量達(dá)到4500萬(wàn)以上,。
更可怕的是,這次“斷連”事件不僅影響范圍廣,,恢復(fù)時(shí)間還很長(zhǎng),。
據(jù)網(wǎng)友評(píng)論稱(chēng),,很多人在下午兩點(diǎn)左右就出現(xiàn)了不能撥打電話(huà)的情況。官方微博在下午4點(diǎn)左右通報(bào)了這一事件,。
不過(guò),,斷連被沒(méi)能像以往一樣很快恢復(fù)。
一般來(lái)說(shuō),,發(fā)生概率最高的服務(wù)器宕機(jī)事件可以通過(guò)重啟服務(wù)器解決,。而省級(jí)電信部門(mén)是一定擁有一套可快速上線的服務(wù)器備份的。在備用服務(wù)器協(xié)助下重啟,,可以保證絕大部分問(wèn)題在半小時(shí)內(nèi)解決,。
2021年12月10日下午5點(diǎn)20左右,陜西電信曾出現(xiàn)網(wǎng)絡(luò)故障,,西安,、臨潼、寶雞等多地用戶(hù)無(wú)法上網(wǎng),,但在下午5點(diǎn)50分前后,,網(wǎng)絡(luò)就已經(jīng)基本順暢。2022年1月12日0:27,,中國(guó)電信出海信號(hào)受阻,,官方通報(bào)為設(shè)備故障,經(jīng)過(guò)緊急處置,,于0:51修復(fù)完畢,。
然而回顧本次事件,通信全面恢復(fù)時(shí)間可能長(zhǎng)達(dá)4-5小時(shí),。直到晚上7點(diǎn)多才完全恢復(fù),。
本次事件還有一點(diǎn)十分特殊,就是受影響用戶(hù)僅電話(huà)與短信功能無(wú)法使用,,上網(wǎng)功能不受影響,。
在斷連之初,電信內(nèi)部其實(shí)已經(jīng)流出了本次事故的大致原因,。后來(lái)經(jīng)過(guò)多名通信專(zhuān)家確認(rèn),,已經(jīng)可以基本得出結(jié)論:廣東電信的核心網(wǎng)出現(xiàn)故障,,LDRA到HDRA之間鏈路出現(xiàn)擁塞現(xiàn)象,。專(zhuān)家解釋?zhuān)溌窊砣蚩赡転槟吃O(shè)備商的數(shù)通設(shè)備出現(xiàn)異常,導(dǎo)致數(shù)據(jù)包重傳,,引起信令風(fēng)暴,。應(yīng)急處理方法是在SBC部署了流量控制流程,以及將某設(shè)備商的路由器隔離,。
什么是LDRA與HDRA,?為什么只有廣東電信的用戶(hù)受影響,?為什么故障只影響通話(huà)而不影響網(wǎng)絡(luò)?本文將帶你分析手機(jī)通話(huà)的內(nèi)部過(guò)程,,找到斷連的真正原因,。
從撥出到接聽(tīng),發(fā)生了什么,?
手機(jī)從電話(huà)按下?lián)艹鲦I,,到接聽(tīng)人接聽(tīng)為止,這一過(guò)程并不簡(jiǎn)單,,其中要涉及到復(fù)雜的信令流程,。
在你撥出電話(huà)前,手機(jī)其實(shí)早早的開(kāi)始準(zhǔn)備將你的“聲音”傳遞出去,。
通常手機(jī)在剛開(kāi)機(jī)的時(shí)候是不能撥打電話(huà)的,。這時(shí)需要等待手機(jī)進(jìn)行“搜索信號(hào)”。只有當(dāng)手機(jī)頂部狀態(tài)欄出現(xiàn)三大運(yùn)營(yíng)商的名字后,,我們才能撥打電話(huà),。這個(gè)過(guò)程其實(shí)就是在手機(jī)與小區(qū)基站之間建立連接,包含小區(qū)搜索,、讀取系統(tǒng)廣播(隨機(jī)接入)和網(wǎng)絡(luò)側(cè)注冊(cè)登記(附著)三個(gè)過(guò)程,。
這里的“小區(qū)”并不是我們認(rèn)識(shí)中的居住小區(qū),而是被蜂窩網(wǎng)絡(luò)劃分出的一個(gè)個(gè)六邊形區(qū)域,,每個(gè)區(qū)域都會(huì)有一個(gè)基站,。通常來(lái)講一個(gè)基站對(duì)應(yīng)一個(gè)小區(qū),即以基站為中心的一片覆蓋區(qū)域,,若基站覆蓋范圍較大,,還可以將小區(qū)劃為不同的扇區(qū),一根天線負(fù)責(zé)一個(gè)扇區(qū)的信號(hào)傳輸,。
當(dāng)手機(jī)開(kāi)機(jī)后,,一般會(huì)從手機(jī)射頻端檢測(cè)出一個(gè)功率最大的小區(qū),接著手機(jī)會(huì)和該小區(qū)的基站達(dá)成頻率與時(shí)隙同步,,這樣手機(jī)就可以使用當(dāng)前基站的網(wǎng)絡(luò)服務(wù),,最后再進(jìn)行驗(yàn)證等工作,確認(rèn)該手機(jī)入網(wǎng)的合法性,。之后你就具備了撥打電話(huà)的條件了,。這個(gè)過(guò)程在開(kāi)機(jī)后會(huì)多次重復(fù),使手機(jī)始終與信號(hào)最強(qiáng)的基站(或多個(gè)近處的基站)保持連接,。
回到打電話(huà)的流程中,,手機(jī)中的麥克風(fēng)會(huì)將聲音這種模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),通過(guò)基帶芯片進(jìn)行編碼后,通過(guò)天線將信號(hào)(高頻脈沖)散發(fā)出去,?;镜氖瞻l(fā)器收到信號(hào),會(huì)對(duì)信號(hào)進(jìn)行進(jìn)一步處理并上行,,然后通過(guò)光纜傳遞到目標(biāo)區(qū)域的基站,。之后的流程便是將上述流程反向走一遍,接收方就能聽(tīng)到語(yǔ)音了,。
不過(guò),,這個(gè)過(guò)程十分簡(jiǎn)化,其中也省略了一個(gè)關(guān)鍵步驟,,基站怎么知道你要打電話(huà)的人在哪個(gè)基站旁邊,?其實(shí),這個(gè)流程與手機(jī)初次連接基站時(shí)的信息交換相關(guān),。手機(jī)SIM卡在注冊(cè)時(shí)都會(huì)有歸屬地,,比如本次上了熱搜的廣東電信,歸屬地就是廣東,,當(dāng)然歸屬地往往還會(huì)細(xì)分,,例如廣州電信、深圳電信,、佛山電信等,。歸屬地的交換中心(MSC)中會(huì)存儲(chǔ)所有注冊(cè)的SIM卡信息。
MSC具有號(hào)碼儲(chǔ)存譯碼,、呼叫處理,、路由選擇、回波抵消,、超負(fù)荷控制等功能,。作為網(wǎng)絡(luò)核心,還支持位置登記,、越區(qū)切換和自動(dòng)漫游等移動(dòng)管理功能,,以及信道管理、數(shù)據(jù)傳輸,,以及包括鑒權(quán),、信息加密、移動(dòng)設(shè)備識(shí)別等安全保密功能,。
當(dāng)手機(jī)上網(wǎng)后,,運(yùn)營(yíng)商的服務(wù)器(交換中心,MSC)會(huì)記錄該手機(jī)最后出現(xiàn)在哪個(gè)基站旁邊,。
如果呼出用戶(hù)和被呼用戶(hù)都在歸屬地,,那么手機(jī)的信號(hào)就會(huì)通過(guò)呼出手機(jī)——基站——呼出地MSC——光纜(核心網(wǎng)內(nèi)部通信)——被呼地MSC——基站——被呼手機(jī)傳輸。
如果被呼用戶(hù)不在歸屬地,,被呼MSC會(huì)向被呼用戶(hù)所在地的MSC轉(zhuǎn)發(fā)呼叫請(qǐng)求,,再通過(guò)基站連接。這個(gè)路徑就是呼出手機(jī)——基站——呼出地MSC——光纜——被呼歸屬地MSC(轉(zhuǎn)發(fā)請(qǐng)求)——光纜——被呼地MSC——基站——被呼手機(jī),,此時(shí)呼出地與被呼地之間仍然通過(guò)核心網(wǎng)內(nèi)部光纜直連,,但這中間需要通過(guò)當(dāng)?shù)氐腗SC轉(zhuǎn)發(fā)才能接通。
斷連的原因
在初步的了解了手機(jī)通話(huà)原理后,,我們來(lái)嘗試一步步分析斷連原因,。
或許你曾經(jīng)有過(guò)這種經(jīng)歷,當(dāng)你正在玩手機(jī)網(wǎng)游,,與對(duì)手大戰(zhàn)300回合的時(shí)候,,突然一個(gè)電話(huà)打過(guò)來(lái),手機(jī)瞬間失去網(wǎng)絡(luò)連接,。雖然你一瞬間掛掉了電話(huà),,但這短暫的斷網(wǎng)還是讓你輸?shù)袅岁P(guān)鍵團(tuán)戰(zhàn),導(dǎo)致游戲失敗,。
如今這種令人“暴躁”的經(jīng)歷已成歷史,,4G時(shí)代后,使用VoLTE網(wǎng)絡(luò)的手機(jī)已經(jīng)可以做到邊打電話(huà)邊上網(wǎng)了,。這種改變的關(guān)鍵,,就在于過(guò)去上網(wǎng)與通話(huà)使用的是同一條鏈路,如今則變?yōu)閮蓷l,,打電話(huà)業(yè)務(wù)通過(guò)IMS(IP Multimedia Subsystem,,IP多媒體子系統(tǒng))線路傳輸,而互聯(lián)網(wǎng)則通過(guò)LTE線路傳輸,,通話(huà)再也不會(huì)占用網(wǎng)絡(luò)通信的通道,。
正是由于通話(huà)與網(wǎng)絡(luò)各自獨(dú)立,造成了故障僅影響通話(huà)與短信,,而不影響網(wǎng)絡(luò)的結(jié)果,。不過(guò)這僅解釋了其中一部分原因,斷連的關(guān)鍵還是要剖析核心網(wǎng)內(nèi)部的故障,。
我們常見(jiàn)的網(wǎng)絡(luò)構(gòu)造,,從2G到5G,基本可分為3層,,即接入層,、匯聚層、核心網(wǎng),。我們?nèi)粘D芸吹降幕?,就屬于接入層?/p>
當(dāng)基站收集到手機(jī)發(fā)出的信號(hào)后,,會(huì)經(jīng)過(guò)承載網(wǎng)傳輸?shù)胶诵木W(wǎng),承載網(wǎng)可以簡(jiǎn)單理解為信號(hào)的傳輸高速路,,通過(guò)光纖將信號(hào)從基站傳輸?shù)胶诵木W(wǎng)上,。這一過(guò)程與前文提到的手機(jī)撥打電話(huà)的通信過(guò)程類(lèi)似。
核心網(wǎng)是連接移動(dòng)接入網(wǎng)和外部網(wǎng)絡(luò)的關(guān)鍵部分,,為用戶(hù)提供了核心業(yè)務(wù)的支持,,如語(yǔ)音通話(huà)、短信,、數(shù)據(jù)業(yè)務(wù)等,。它就像一個(gè)巨大的交換機(jī)或路由器,將來(lái)自世界不同角落的信號(hào)分發(fā)到目的地,。因此,,核心網(wǎng)需要支持海量的用戶(hù)接入,還需要保證高可靠性與安全性,。
前文提到的MSC交換機(jī)也是核心網(wǎng)的一部分,,只不過(guò)MSC是基于2G通信網(wǎng)絡(luò)架設(shè)的,在進(jìn)入LTE時(shí)代后,,MSC的功能就被集成在了電路域(CS網(wǎng)絡(luò))中,,3G時(shí)代又歸為IMS系統(tǒng)中。
隨著4G,、5G網(wǎng)絡(luò)的鋪開(kāi),,核心網(wǎng)逐級(jí)向基于IP的全互聯(lián)的網(wǎng)狀網(wǎng)絡(luò)轉(zhuǎn)向,這其中業(yè)務(wù),、安全,、維護(hù)及擴(kuò)展性等問(wèn)題,都將成為網(wǎng)關(guān)升級(jí)重點(diǎn),。目前,,DRA的部署和建設(shè),可以真正實(shí)現(xiàn)核心網(wǎng)的擴(kuò)展,,簡(jiǎn)化網(wǎng)絡(luò),,實(shí)現(xiàn)快速部署、高效維護(hù)及增強(qiáng)網(wǎng)絡(luò)安全,。
DRA即Diameter Routing Agent,,路由代理節(jié)點(diǎn)。DRA節(jié)點(diǎn)負(fù)責(zé)LTE Diameter信令目的地址翻譯和轉(zhuǎn)接, 實(shí)現(xiàn)LTE用戶(hù)的鑒權(quán),、位置更新,、計(jì)費(fèi)管理等功能。Diameter信令網(wǎng)采用分級(jí),、分區(qū)組網(wǎng)架構(gòu),,由信令轉(zhuǎn)接點(diǎn)DRA分區(qū)匯接Diameter信令節(jié)點(diǎn)的信令消息,。一般DRA節(jié)點(diǎn)會(huì)劃分省內(nèi)與省外。其中省內(nèi)按照各地區(qū)承載量部署LDRA,,每個(gè)LDRA再劃分不同網(wǎng)元,,網(wǎng)元與不同LDRA通過(guò)網(wǎng)狀相連。最終,,省內(nèi)不同的LDRA會(huì)統(tǒng)一接入省級(jí)的HDRA中。
現(xiàn)在我們可以簡(jiǎn)單分析廣東電信斷連的真正原因了,。
從通報(bào)中,,我們了解到LDRA向HDRA傳輸受阻,而本次事故影響遍及全省,,則HDRA的某臺(tái)設(shè)備出問(wèn)題的概率較高,。其中DRA節(jié)點(diǎn)掌握著用戶(hù)的鑒權(quán)、位置更新等重要功能,,可以說(shuō)已經(jīng)成為本地用戶(hù)的數(shù)據(jù)庫(kù),。DRA還承擔(dān)了曾經(jīng)MSC交換機(jī)的責(zé)任,負(fù)責(zé)向外界發(fā)送注冊(cè)用戶(hù)信息,。因此,,重要DRA節(jié)點(diǎn)宕機(jī),導(dǎo)致整條IMS線路不通,,直接影響了所有廣東電信用戶(hù)的通話(huà)與短信功能,,即使是身處外地的用戶(hù)也無(wú)法避免“用戶(hù)數(shù)據(jù)庫(kù)丟失”的問(wèn)題。
有業(yè)內(nèi)人士分析了多個(gè)受影響案例后發(fā)現(xiàn),,廣東電信用戶(hù)之間不能互打電話(huà),,顯示空號(hào),而電信用戶(hù)撥打其他運(yùn)營(yíng)商(移動(dòng),、連通)則可以打通,,反過(guò)來(lái)卻不行。這也證明DRA某設(shè)備損壞推論的合理性,。
寫(xiě)在最后
其實(shí),,本次廣東電信大范圍長(zhǎng)時(shí)間斷連背后,其實(shí)隱藏著一個(gè)更加重要的隱患,,那就是防災(zāi)冗余機(jī)制沒(méi)能發(fā)揮作用,。
2022年12月,人民郵電報(bào)刊文《中國(guó)電信研究院:5G核心網(wǎng)容災(zāi)和安全能力提升》,,文中重點(diǎn)講述了中國(guó)電信已經(jīng)實(shí)現(xiàn)了5G核心網(wǎng)用戶(hù)數(shù)據(jù)庫(kù)網(wǎng)元全故障極端場(chǎng)景下仍保持用戶(hù)業(yè)務(wù)的可用,,數(shù)據(jù)逃生時(shí)長(zhǎng)從原本的180分鐘縮短到10分鐘。
其中在辦法的實(shí)施上,,中國(guó)電信采用5G用戶(hù)數(shù)據(jù)庫(kù)全故障快速應(yīng)急逃生方案,,當(dāng)雙機(jī)熱備的兩臺(tái)用戶(hù)數(shù)據(jù)庫(kù)網(wǎng)元中的一臺(tái)發(fā)生故障時(shí),,就觸發(fā)提前向4G核心網(wǎng)快速批量導(dǎo)入用戶(hù)逃生數(shù)據(jù);當(dāng)5G用戶(hù)數(shù)據(jù)庫(kù)兩臺(tái)都發(fā)生故障時(shí),,快速逃生到由4G核心網(wǎng)承接業(yè)務(wù),。文章講到,該方案在5G用戶(hù)數(shù)據(jù)庫(kù)網(wǎng)元全故障場(chǎng)景下,,對(duì)已經(jīng)在線的用戶(hù)啟用特殊的免鑒權(quán)流程,,保障超過(guò)80%已在線用戶(hù)的基礎(chǔ)業(yè)務(wù)不受影響。
然而本次斷連事件中,,中國(guó)電信曾經(jīng)測(cè)試的防災(zāi)措施并沒(méi)有發(fā)揮作用,,甚至數(shù)據(jù)恢復(fù)時(shí)間要遠(yuǎn)超180分鐘。這或許是因?yàn)?G核心網(wǎng)并沒(méi)有出現(xiàn)故障,,該防災(zāi)機(jī)制并沒(méi)有設(shè)置3G數(shù)據(jù)向上逃逸的方案,。
但就目前來(lái)說(shuō),電話(huà)與短信仍然是用戶(hù)的重要通信方案,,它并沒(méi)有因?yàn)閿?shù)據(jù)網(wǎng)絡(luò)的出現(xiàn)而完全消失,。更重要的是,無(wú)論4G,、5G通信有多快,,但依舊面臨覆蓋面積有限的問(wèn)題,因此2G或3G通信仍舊是重要的備份通信方式,。
縱使電話(huà)與短信功能的重要性在逐漸下降,,還是希望全國(guó)運(yùn)營(yíng)商能能通過(guò)該事件警醒,繼續(xù)提高或優(yōu)化防災(zāi)能力,,若未來(lái)發(fā)生“斷網(wǎng)”5小時(shí)事故的話(huà),,那造成的影響,可能就不可估量了,。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<