高端交換機(jī)硬件架構(gòu)——CLOS架構(gòu)
數(shù)據(jù)中心交換機(jī)為了支撐網(wǎng)絡(luò)內(nèi)部大量的內(nèi)部流量,傳統(tǒng)的收斂網(wǎng)絡(luò)已經(jīng)無(wú)法滿足這些流量的高效傳輸;對(duì)于數(shù)據(jù)中心網(wǎng)絡(luò)來(lái)說(shuō),無(wú)阻塞就是實(shí)現(xiàn)任意服務(wù)器之間可以線速交互流量的方式。也就是數(shù)據(jù)中心更多提到的這種叫做CLOS架構(gòu)的無(wú)阻塞網(wǎng)絡(luò)。
作為數(shù)據(jù)中心交換機(jī),為了支撐數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)部大量的內(nèi)部流量,傳統(tǒng)的收斂網(wǎng)絡(luò)已經(jīng)無(wú)法滿足這些流量的高效傳輸了。所以如今的數(shù)據(jù)中心更多的是在提一種叫做CLOS①架構(gòu)的無(wú)阻塞網(wǎng)絡(luò)。對(duì)于數(shù)據(jù)中心網(wǎng)絡(luò)來(lái)說(shuō),無(wú)阻塞就是實(shí)現(xiàn)任意服務(wù)器之間可以線速交互流量的方式。而對(duì)于單一高端交換機(jī)來(lái)說(shuō),無(wú)阻塞就是實(shí)現(xiàn)單個(gè)交換機(jī)內(nèi)部的數(shù)據(jù)永遠(yuǎn)不發(fā)生阻塞的傳輸。
1、CLOS架構(gòu)的產(chǎn)生與特點(diǎn)
說(shuō)到CLOS架構(gòu),先來(lái)講講歷史,也就是CLOS架構(gòu)產(chǎn)生的歷史。
其實(shí)CLOS架構(gòu)這個(gè)東西算是老樹(shù)新花了。由Charles Clos于1953年首次正式使用該術(shù)語(yǔ),它代表了實(shí)際多級(jí)電話交換系統(tǒng)的理想化表示。所以當(dāng)時(shí)這老先生在想出這個(gè)架構(gòu)的時(shí)候?qū)嶋H上是為電話交換系統(tǒng)使用的,沒(méi)想到的是幾十年之后的今天,高端交換機(jī)路由器遇到高速轉(zhuǎn)發(fā)的問(wèn)題時(shí),又重新用起了這個(gè)架構(gòu),所以說(shuō)CLOS架構(gòu)并不是一個(gè)新概念。
CLOS架構(gòu)只是一個(gè)架構(gòu)形式,可以用于交換機(jī)內(nèi)部通過(guò)多個(gè)Crossbar交換矩陣排列組合形成,也可以用于宏觀上的多個(gè)交換機(jī)排列組合成CLOS架構(gòu),而他們的目的是相同的,那就是無(wú)阻塞。而CLOS架構(gòu)又是怎么實(shí)現(xiàn)無(wú)阻塞的呢?
CLOS架構(gòu)是由二個(gè)參數(shù)k,n來(lái)定義。CLOS架構(gòu)分為三級(jí),在第一級(jí),也就是CLOS架構(gòu)的輸入端,有k個(gè)輸入階段的輸入設(shè)備,每一個(gè)輸入階段設(shè)備都有n個(gè)輸入和k個(gè)輸出。中間階段Crossbar Switch有k個(gè)。每一個(gè)輸入階段交換與每一個(gè)中間階段交換之間只有一個(gè)連接。總共具有k個(gè)輸出階段交換,每一個(gè)都具有k個(gè)輸入和n個(gè)輸出。每一個(gè)中間階段交換與每一個(gè)輸出階段交換只有一個(gè)連接。具體CLOS架構(gòu)如下圖所示。

圖1:CLOS架構(gòu)示意圖
所以,我們可以看出,CLOS架構(gòu)的特點(diǎn)有:
- 多級(jí)交換,典型為三級(jí)交換架構(gòu)
- 在每一級(jí)的每個(gè)單元都與下一級(jí)的設(shè)備全連接
- 到指定目的地,在第1級(jí)交換單元存在多條路由,而后續(xù)交換單元都只存在唯一的一條路由
- 嚴(yán)格意義上的無(wú)阻塞
- 支持遞歸,可無(wú)限擴(kuò)展
第一級(jí)和第三級(jí),也就是輸入端和輸出端的數(shù)量是一致的,這個(gè)概念用于部署網(wǎng)絡(luò)的層面上就是輸入端和輸出端的輸入/輸出帶寬是一致的,也就是說(shuō)我上聯(lián)到第二層的帶寬是10G,那么第二層下聯(lián)到輸出端的帶寬也要是10G,或者第二層上聯(lián)到第三層的鏈路必須是k*10G的帶寬才行,這種形式的連接才能實(shí)現(xiàn)真正的無(wú)阻塞
以上便是CLOS架構(gòu)的大體概念。需要注意的是CLOS架構(gòu)只是一種幾何拓?fù)浣Y(jié)構(gòu),并不是一種專(zhuān)門(mén)用于交換矩陣的結(jié)構(gòu),更不是一種新型的交換矩陣。只不過(guò)廠商把CLOS架構(gòu)用在了部署Crossbar交換矩陣中,實(shí)現(xiàn)高端交換機(jī)內(nèi)部的無(wú)阻塞轉(zhuǎn)發(fā)。
2、基于CLOS的交換架構(gòu)
讀者可能有這樣一個(gè)疑問(wèn),支持交換網(wǎng)板的交換機(jī)交換網(wǎng)板的數(shù)量頂多就9塊,怎么部署CLOS架構(gòu),更不用說(shuō)沒(méi)有交換網(wǎng)板的交換機(jī)了,只有兩個(gè)引擎,每個(gè)引擎上只有一個(gè)Crossbar,更沒(méi)辦法組建CLOS架構(gòu)了。所以可能會(huì)像之前筆者想的一樣,分布式Crossbar就是CLOS架構(gòu),每個(gè)線卡上一個(gè)Crossbar,從而可以實(shí)現(xiàn)三級(jí)的CLOS架構(gòu)。但是我們通過(guò)上面對(duì)分布式Crossbar的辨析我們已經(jīng)知道了這種方式其實(shí)并不是真正實(shí)現(xiàn)的。所以其實(shí)對(duì)于具有交換網(wǎng)板的交換機(jī),每個(gè)交換網(wǎng)板上可以有多個(gè)Crossbar,或者把MAC芯片當(dāng)做輸入或者輸出級(jí),所以同樣也可以實(shí)現(xiàn)CLOS架構(gòu)。而實(shí)現(xiàn)形式與之前講解的CLOS架構(gòu)一樣。所以這也是有交換網(wǎng)板的交換機(jī)的優(yōu)勢(shì)之一,實(shí)現(xiàn)交換矩陣與引擎的物理分離,可以有更高的擴(kuò)展性擴(kuò)充更多的Crossbar資源來(lái)組件CLOS架構(gòu)。
3、基于CLOS的網(wǎng)絡(luò)架構(gòu)
CLOS架構(gòu)的網(wǎng)絡(luò)拓?fù)淦鋵?shí)比CLOS架構(gòu)的交換矩陣實(shí)現(xiàn)起來(lái)更為容易,并且更容易理解。我這里以我司為阿里巴巴設(shè)計(jì)的方案為例,講解下基于CLOS架構(gòu)的網(wǎng)絡(luò)拓?fù)洹?br />

圖2:阿里巴巴網(wǎng)絡(luò)CLOS架構(gòu)示意圖
網(wǎng)絡(luò)拓?fù)淙缟纤尽R?臺(tái)S6200-48XS為數(shù)據(jù)中心核心,48臺(tái)S6080為接入組成CLOS網(wǎng)絡(luò)。一臺(tái)S6080有80個(gè)千兆端口作為接入口,用8個(gè)萬(wàn)兆作為上聯(lián)端口與8臺(tái)核心S6200的萬(wàn)兆端口進(jìn)行全連接,從而實(shí)現(xiàn)10個(gè)千兆接入口與一個(gè)萬(wàn)兆上聯(lián)口對(duì)應(yīng),相同的,S6200下聯(lián)也是如此連接。對(duì)于接入設(shè)備來(lái)說(shuō),有多少帶寬接入,就用多少帶寬上聯(lián),并且輸入輸出的帶寬是1:1對(duì)等的,從而實(shí)現(xiàn)CLOS架構(gòu)。
所以通過(guò)這個(gè)案例可以看出,想要實(shí)現(xiàn)網(wǎng)絡(luò)拓?fù)涞腃LOS架構(gòu),只要讓下聯(lián)和上聯(lián)的帶寬1:1對(duì)等,同時(shí)讓網(wǎng)絡(luò)的上行和下行的帶寬1:1對(duì)等,實(shí)現(xiàn)無(wú)阻塞網(wǎng)絡(luò),就基本達(dá)到了組建CLOS架構(gòu)的目的了。
① “CLOS”名字取自它的發(fā)明者Charles Clos的姓氏。
客戶(hù)評(píng)論
我要評(píng)論
您的姓名
您的手機(jī)號(hào)*
您的郵箱
公司名稱(chēng)
更多技術(shù)博文
-
解密DeepSeek-V3推理網(wǎng)絡(luò):MoE架構(gòu)如何重構(gòu)低時(shí)延、高吞吐需求?DeepSeek-V3發(fā)布推動(dòng)分布式推理網(wǎng)絡(luò)架構(gòu)升級(jí),MoE模型引入大規(guī)模專(zhuān)家并行通信,推理流量特征顯著變化,Decode階段對(duì)網(wǎng)絡(luò)時(shí)度敏感。網(wǎng)絡(luò)需保障低時(shí)延與高吞吐,通過(guò)端網(wǎng)協(xié)同負(fù)載均衡與擁塞控制技術(shù)優(yōu)化性能。高效運(yùn)維實(shí)現(xiàn)故障快速定位與業(yè)務(wù)高可用,單軌雙平面與Shuffle多平面組網(wǎng)方案在低成本下滿足高性能推理需求,為大規(guī)模MoE模型部署提供核心網(wǎng)絡(luò)支撐。
-
#交換機(jī)
-
-
高密場(chǎng)景無(wú)線網(wǎng)絡(luò)新解法:銳捷Wi-Fi 7 AP 與 龍伯透鏡天線正式成團(tuán)銳捷網(wǎng)絡(luò)在中國(guó)國(guó)際大學(xué)生創(chuàng)新大賽(2025)總決賽推出旗艦Wi-Fi 7無(wú)線AP RG-AP9520-RDX及龍伯透鏡天線組合,針對(duì)高密場(chǎng)景實(shí)現(xiàn)零卡頓、低時(shí)延和高并發(fā)網(wǎng)絡(luò)體驗(yàn)。該方案通過(guò)多檔賦形天線和智能無(wú)線技術(shù),有效解決干擾與覆蓋問(wèn)題,適用于場(chǎng)館、辦公等高密度環(huán)境,提供穩(wěn)定可靠的無(wú)線網(wǎng)絡(luò)解決方案。
-
#無(wú)線網(wǎng)
-
#Wi-Fi 7
-
#無(wú)線
-
#放裝式AP
-
-
打造“一云多用”的算力服務(wù)平臺(tái):銳捷高職教一朵云2.0解決方案發(fā)布銳捷高職教一朵云2.0解決方案幫助學(xué)校構(gòu)建統(tǒng)一云桌面算力平臺(tái),支持教學(xué)、實(shí)訓(xùn)、科研和AI等全場(chǎng)景應(yīng)用,實(shí)現(xiàn)一云多用。通過(guò)資源池化和智能調(diào)度,提升資源利用效率,降低運(yùn)維成本,覆蓋公共機(jī)房、專(zhuān)業(yè)實(shí)訓(xùn)、教師辦公及AI教學(xué)等多場(chǎng)景需求,助力教育信息化從分散走向融合,推動(dòng)規(guī)模化與個(gè)性化培養(yǎng)結(jié)合。
-
#云桌面
-
#高職教
-
-
醫(yī)院無(wú)線升級(jí)必看:“全院零漫游”六大謎題全解析銳捷網(wǎng)絡(luò)的全院零漫游方案是新一代醫(yī)療無(wú)線解決方案,專(zhuān)為智慧醫(yī)院設(shè)計(jì),通過(guò)零漫游主機(jī)和天線入室技術(shù)實(shí)現(xiàn)全院覆蓋和移動(dòng)零漫游體驗(yàn)。方案支持業(yè)務(wù)擴(kuò)展全適配,優(yōu)化運(yùn)維管理,確保內(nèi)外網(wǎng)物理隔離安全,并便捷部署物聯(lián)網(wǎng)應(yīng)用,幫助醫(yī)院提升網(wǎng)絡(luò)性能,支持舊設(shè)備利舊升級(jí),降低成本。
-
#醫(yī)療
-
#醫(yī)院網(wǎng)絡(luò)
-
#無(wú)線
-