微軟透露,本周的Microsoft 365全球故障是由基礎(chǔ)設(shè)施停電引起的,停電導(dǎo)致在多個(gè)地區(qū)為用戶提供服務(wù)的流量管理管理進(jìn)行故障切換。
從6月20日星期一晚上11點(diǎn)00分開(kāi)始,客戶在嘗試訪問(wèn)和使用Microsoft 365服務(wù)時(shí)開(kāi)始遇到并報(bào)告幾個(gè)問(wèn)題。據(jù)微軟聲稱,這次事件中遇到的問(wèn)題包括訪問(wèn)某些Microsoft 365服務(wù)時(shí)出現(xiàn)延遲和失敗。
客戶報(bào)告問(wèn)題時(shí)還透露了這些方面的信息:持續(xù)的重新登錄請(qǐng)求、電子郵件在排隊(duì)后未投遞,以及盡管嘗試了所有可以使用的連接方法,仍無(wú)法訪問(wèn)Exchange Online郵箱。受影響的服務(wù)包括:Microsoft Teams通訊平臺(tái)、Exchange Online托管電子郵件平臺(tái)、SharePoint Online、Universal Print和Graph API。
微軟在調(diào)查故障的根本原因后作出了回應(yīng),也揭示了與該公司未向客戶透露新的事件信息有關(guān)的一些問(wèn)題。
盡管微軟告訴客戶他們可以在EX394347和MO394389下從管理中心找到有關(guān)此事件的更多信息,但用戶報(bào)告表明這些事件故障單并沒(méi)有出現(xiàn),因此客戶實(shí)際上蒙在鼓里。
停電導(dǎo)致長(zhǎng)達(dá)16個(gè)小時(shí)的事故
在6月21日星期二下午3點(diǎn)27分,此時(shí)距離發(fā)現(xiàn)停電的最初跡象已過(guò)去逾16個(gè)小時(shí),微軟在發(fā)給客戶的MO394389服務(wù)警報(bào)的最新消息中表示,根本原因是基礎(chǔ)設(shè)施停電。
“基礎(chǔ)設(shè)施停電后,為主要在西歐的用戶提供服務(wù)的Microsoft 365流量管理系統(tǒng)勢(shì)必需要進(jìn)行故障切換?!痹摴窘忉尩溃霸摬僮魑茨苷_完成,導(dǎo)致多項(xiàng)Microsoft 365服務(wù)出現(xiàn)功能延遲和訪問(wèn)失敗?!?/span>
對(duì)于西歐的客戶來(lái)說(shuō),故障最為嚴(yán)重。不過(guò),故障影響蔓延到了整個(gè)歐洲中東非洲(EMEA)、北美和亞太地區(qū)的“一小部分”用戶。
微軟還駁斥了聲稱影響該公司Outlook網(wǎng)頁(yè)版服務(wù)的另一起故障也與此事件有關(guān)的說(shuō)法?!拔覀円褟奈覀兏潞蟮姆?wù)監(jiān)控確認(rèn),所有服務(wù)在目標(biāo)系統(tǒng)重啟后都保持正常運(yùn)行。”微軟補(bǔ)充說(shuō),“此外,我們完成了對(duì)Outlook網(wǎng)頁(yè)版可能受到的剩余影響的調(diào)查,確認(rèn)這是一個(gè)與這次事件無(wú)關(guān)的已知問(wèn)題。”
Cloudflare在星期二也遭受了大規(guī)模中斷,這次事件影響了十幾個(gè)數(shù)據(jù)中心和成百上千的主要在線平臺(tái)和服務(wù)。
Cloudflare后來(lái)透露,該事件是在實(shí)施變更時(shí)遇到的配置錯(cuò)誤引起的,實(shí)施變更的本意是為了提高網(wǎng)絡(luò)彈性。

