百年电信老店,为何频出重大断网事故?

百年电信老店,为何频出重大断网事故?
2024年09月06日 16:44 媒体滚动

AT&T,电信业的一块金字招牌。这家有着百年历史、曾经孕育出“贝尔实验室”的企业曾经称霸电信业,风头无两,如今依然是美国电信业的巨头,但近一年来,AT&T却频频遭遇重大断网和安全事故,引发了外界对其的种种质疑,更遭遇了来自客户的空前信任危机。在当下的信息时代,网络已经深度融入社会生产、民众生活的方方面面,信息通信技术相比以往更加不可或缺,断网带来的后果更是不可估量。那么,深知这一点的AT&T为何会让自己频频陷入此等困境?一旦发生重大断网事故有何应对之法?这又是不是其他电信运营商同样也在面临的难题?别走开,仔细看看以下内容……

!AT&T断网有多频繁?

8月27日,美国大型运营商AT&T公司再度发生重大断网事故。这是该公司最近的一次断网事故。该公司无线服务对部分用户中断,导致911急救电话无法拨通。问题在几个小时内得到了解决,该公司将原因归咎于软件问题。

具有讽刺意味的是,该断网事故发生前几小时,美国联邦通信委员会(FCC)才宣布与AT&T就去年8月该公司的一次断网事故调查达成了95万美元的和解。该调查旨在确定AT&T是否违反了FCC的规则,未能在2023年8月的一次断网事故中提供911电话服务并及时通知911呼叫中心。

过去几个月中,AT&T频繁发生断网和数据泄露事故,这些问题导致该公司的运营遭遇了质疑,而用户也因此受到影响。

今年2月,AT&T网络瘫痪了11个小时,导致美国许多客户无法拨打电话、发短信或访问互联网。AT&T表示,对该次断网的初步审查发现,可能是由公司内部错误而不是网络攻击造成的。

几周后的3月,一份包含7300万名现有和前客户个人信息的数据被泄露,引发了安全担忧。AT&T表示,这些数据来自2019年或更早,似乎不包含财务或通话记录的具体信息。该公司当时表示:“目前尚不清楚这些数据……是来自AT&T还是其供应商之一。”

今年6月,AT&T又一次发生断网,导致部分客户无法进行与其他运营商的网间通话,问题在几个小时内得到解决,但该公司并未透露问题原因。

7月,AT&T遭遇一场安全“噩梦”,数千万名AT&T手机用户和许多非AT&T用户的通话与短信记录在一次大规模数据泄露中被曝光。泄露的数据包括2022年5月1日至2022年10月31日期间使用其网络的“几乎所有”蜂窝客户和其他无线提供商客户的电话号码。

!频繁断网原因何在?

为什么近一段时间AT&T频繁发生断网事故?有电信专家指出,这是三个问题的综合体现,包括大城市的网络超负荷、软件更新失控以及各种技术问题。

以8月底最近的这次断网为例,纽约、北卡罗来纳州夏洛特、休斯敦和芝加哥均遭遇了断网。专门分析移动电话公司的Besen Group公司创始人兼首席执行官Alex Besen表示,相信这是一个网络过载问题,他建议:“为了避免将来出现任何中断,AT&T需要增加手机信号塔的数量,应用先进的负载平衡技术,使用网络优化工具以便更有效地管理流量,并优先提供可以减少网络拥塞的服务。”

卡内基梅隆大学海因茨学院数字媒体和营销学教授Ari Lightman表示,AT&T对8月27日断网事故是软件问题的回应“让人无法确定这是实施方面的问题还是代码中的错误”。

断网事故调查烦琐,耗时良久。但从今年2月的断网事故调查中,或许可对AT&T断网频发的原因略知一二。

今年7月底,美国联邦通信委员会在经过约5个月的调查后给出了最终报告,称AT&T大规模断网的直接原因是一名员工错误配置了一个网络元素,导致AT&T的网络做出响应,进入“保护模式”,随后断开了所有无线设备的连接。该事件影响了1.25亿台设备并阻断了9200万次通话以及2.5万次911(急救电话)呼叫,受影响用户遍布全美50个州,事件期间AT&T无线客户的所有语音和5G数据服务均不可用,依赖AT&T网络的虚拟运营商也无法访问这些服务。

值得注意的是,在此次事件中,美国的FirstNet也被阻断。FirstNet是美国国会授权建立的一张全国性的无线宽带专网,旨在为公共安全维护保障人员以及其他现场应急响应人员提供高效可靠的通信保障,更好地实施救援。FirstNet由AT&T负责建设运营。报告称,尽管AT&T优先恢复了FirstNet,但也是直到断网3小时后才通知FirstNet客户。

报告发现,AT&T的实验室测试“未发现导致中断的网络元素配置不当”,提供商进行的实验室测试“未发现该或类似配置错误对网络的潜在影响”。

报告的另一项发现涉及安装后测试问题。FCC的调查推测AT&T“要么缺乏足够的监督和控制”来确保遵循安装后的测试实践,要么该公司本身应用的流程不规范。

!断网后果有多严重?

在高度数字化的当下,断网带来的损失可谓极其严重。根据互联网监测平台NetBlocks测算的数据,全球断网一天的经济损失高达430亿美元(约合3052.4亿元人民币)。其中,美国和中国是受影响最严重的两个国家,断网一天的损失分别达到110亿美元(约合780.8亿元人民币)和100亿美元(约合709.8亿元人民币)。互联网主要影响的是在线购物、银行业、创新服务和技术领域等。

从近期发生的多起断网事故来看,影响可谓触目惊心。

通信中断。最严重的情况下人们甚至无法拨打急救电话,短信、电子邮件或上网功能全阻,对需要急救的人群来说可谓极其危险。

经济损失。高度依赖网络运营的企业一旦遭遇断网,就会导致生产停滞、交易中断、在线销售受影响等。此外,金融交易、股票交易等也将大受影响,从而造成无法估量的经济损失。

社会紧张和安全风险。紧急情况下,人们无法及时获取重要信息,可能引发恐慌或混乱。同时,一些重要的联网安全系统可能也会受到影响,引发风险。

造成社会运行失灵。电力、水处理、交通等诸多公共部门基础设施依赖于通信网络,断网可能干扰这些基础设施的正常运行,引发更广泛的问题。

而对于AT&T来说,频繁发生的断网事故已经产生叠加影响,给该公司带来了经济损失、用户流失、品牌下滑、信任危机等挑战。

针对今年2月的断网事故,AT&T向受影响的用户每个账户提供5美元表示歉意,分析师预计该公司因此损失约4000万美元。而针对去年8月的一次断网事故,AT&T则为此与FCC达成了95万美元的和解。

分析师指出,赔偿并不能消除负面影响,这样的重大断网事故可能让其中一些用户感到紧张,从而造成用户流失。2005年,重组后AT&T以全新的品牌标志重现市场,彼时该公司的品牌在美国民众心中有着超高的认知度,在个人消费者中的认知度高达98%,在企业用户中更是达到100%。而根据网络监控公司Opensignal的数据,今年2月的断网事故发生后一周,AT&T市场份额流失量就增加了12%。

更为严重的是,用户对AT&T的反复断网以及客户服务问题始终未能解决感到越来越失望。每次断网事故发生后,网络上都充斥着大量用户的抱怨。频发的断网以及没有明确解释的做法正在让越来越多的机构和用户对AT&T失去信心。美国纽约州总检察长利蒂希娅·詹姆斯就明确表示:“全国范围内的断网不仅带来不便,还可能很危险,当断网发生时,我们保护消费者至关重要。”

南加州大学专门研究品牌管理和危机沟通的传播学教授Karen North表示,AT&T缺乏沟通可能损害客户对该公司的信心:“当涉及用户时,沉默几乎从来都不是正确的答案。人们需要知道发生了什么,以及什么时候会修复,AT&T需要发出一个非常明确的信息,说明为什么未来应该信任它可以解决问题,AT&T可能需要意识到这不仅仅是一部手机,从职业和个人角度来看,这是人们与家人、朋友和企业之间的‘生命线’。”

显然,在连续数次断网和安全事故后,AT&T需要努力重新赢得客户的信任。

此外,断网事故还可能损害AT&T在某些政策性问题上的努力,例如铜线网络的退役。AT&T此前表示将关闭加利福尼亚州各地的铜缆DSL网络,这是AT&T在全美范围内从铜缆转向光纤和5G战略的一部分。但反对者称替代方案(包括移动服务)并不可靠。断网事故无疑会加重此类担心。

!断网是偶发事件吗?

近几年,随着通信网络的日趋复杂,断网事故已经不再是偶发事件了,仅今年就发生了多起断网事故。

1月,加拿大最大的电信运营商Rogers公司因“技术问题”遭遇重大断网事故,影响包括多伦多、汉密尔顿、圭尔夫、基奇纳、伦敦、巴里、科灵伍德、奥里利亚等众多地区的用户。断网持续约一个小时,仅在高峰期就有超过5.5万名用户报告断网。

1月,法国电信西班牙公司遭遇持续3个小时的断网,导致其近一半的网络流量中断,原因是密码较弱被黑客入侵。

2月,移动通信巨头沃达丰在澳大利亚发生全国范围断网,导致沃达丰用户均无法使用移动通信服务。对于原因,沃达丰澳大利亚公司表示是“技术问题”导致包括通话和数据在内的移动通信服务中断。

2月,英国移动通信运营商3公司(Three UK)的移动网络发生大规模断网,断网涉及英国多个地区,4G、5G连接中断,网内移动用户及其移动虚拟运营商的移动用户均受到影响,受影响用户约1万人,有用户表示唯一可以使用的服务就是紧急通话。

3月,南非、尼日利亚、科特迪瓦、利比里亚、贝宁、加纳和布基纳法索等多个非洲国家均遭遇严重断网事故,数百万名用户的互联网服务中断。有业内人士称,导致此次事故的原因是非洲大陆西海岸的4根海底电缆受损,海床移动是造成海缆断裂的可能原因之一。

3月,澳大利亚电讯遭遇断网,导致紧急求助号码“000”无法使用,影响了数千名用户,更有人因电话求救不及时而过世。

4月,英国移动通信运营商Sky Mobile发生全国范围断网,3G、4G和5G服务均不可用。

5月,南非移动运营商Telkom发生全国范围断网,联网、电话和短信服务均不可用。

6月,印度第一大移动运营商Reliance Jio发生全国性断网,至少持续6小时。

8月,加拿大电信运营商西北电信多地断网,持续数小时,移动及固网服务均不可用。

8月,荷兰三大运营商KPN、沃达丰和Odido相继发生大规模、严重的断网事故。这一突发事件不仅让大量荷兰居民和企业在日常沟通与业务运营上遭遇了严重困扰,更由于荷兰国防部网络中断及数据中心故障,迅速升级为全国性IT故障,波及多个关键领域。

!有何应对和预防之法?

AT&T的遭遇很有代表性:曾经是通信业的技术先锋,如今,随着网络规模化发展和不断演进升级,该公司同时面临巨大的规模建网和运维压力,更重要的是面临高额的建网成本以及持续存在的降本增效压力。

在技术方面,AT&T有辉煌的历史。它曾是“电话之父”亚历山大·贝尔的亲创企业;它曾经连通了人类历史上第一个跨洋电话、第一个全球性电话;它孕育的“贝尔实验室”诞生了晶体管、激光器、C语言、蜂窝技术等重大发明,改变了人类科技发展的进程。相比其他运营商,AT&T在技术领域有雄厚的积淀。其对断网的应对举措也给其他运营商带来了一定的参考。

针对今年2月的断网事故,FCC的报告称,断网发生后,AT&T迅速采取了纠正措施,“在断网发生后的48小时内,AT&T在其网络中实施了额外的技术控制,包括扫描网络中缺失可防止断网的控制网元,并迅速予以实施”。同时,AT&T采取的其他措施还包括实施额外的网络增强功能以提高网络弹性以及额外的同行评审步骤,其目的是确保“只有在确认已完成所需的同行评审之后,维护工作才能开展”,以降低网络操作失误的可能性。

FCC的报告强调,网络运营商在实施网络变更时必须遵守其内部程序和行业最佳实践。这些措施包括实施足够的网络控制以缓解配置错误,以免问题升级并扰乱网络运营。FCC还指出,需要建立具有足够容量的系统和程序,以便从大规模中断中迅速恢复。

不得不说,随着近年来通信技术的不断演进,运营商面临的各种压力也越来越大。首先是网络覆盖,各国对于网络覆盖都有严格的要求。尤其是在人口稀少的偏远地区,运营商建网的成本高、投入回报低、运维难度大,面临较大的压力。其次,随着新一代通信技术的演进,网络的不断演进升级也是一项极具挑战的任务。

今年2月发生断网事故后,AT&T首席运营官Jeff McElfresh就透露,正在投资数十亿美元升级网络以期提供更加卓越的客户服务,“这是一项始终需要关注的挑战”。今年年中,AT&T进一步宣布,预计2024年的资本投资将在210亿至220亿美元之间。投资计划旨在加强网络基础设施,提升服务质量,并支持公司在新兴技术领域的发展。

卡内基梅隆大学海因茨学院数字媒体和营销学教授Ari Lightman也指出,站在AT&T的角度来说,“必须注意网络基础设施的复杂性,因为网络基础设施需要为1.15亿名无线用户提供服务,而且AT&T计划积极推出新网络”。

网络“摊子”铺得很大,运营商面临的压力可想而知。尽管如此,运营商依然有几个方法预防重大断网事故的发生,包括网络规划与扩容、加强备份与冗余、加强网络安全防御、建立监控与报警系统、加强人员培训、建立运营商间的合作补位机制等。

总体来说,在当今高度数字化的时代,断网必然会导致广泛的社会、经济和个人影响,运营商应采取多种措施确保网络的稳定性和安全性。

制图:刘磊

编辑:肖夏 李珮雯

电信电话
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片