《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > AET原創(chuàng) > 采用仿真驗(yàn)證技術(shù)提高AI數(shù)據(jù)中心部署效率

采用仿真驗(yàn)證技術(shù)提高AI數(shù)據(jù)中心部署效率

是德科技全新KAI系列解決方案先人一步
2025-05-23
來源:是德科技

編者按:人工智能技術(shù)的發(fā)展催生了大規(guī)模數(shù)據(jù)中心建設(shè)需求,提高日趨復(fù)雜的數(shù)據(jù)中心建設(shè)部署效率,正在成為算力行業(yè)的競爭焦點(diǎn)。日前,是德科技推出了全新的KAI系列仿真驗(yàn)證解決方案,通過仿真真實(shí)世界的AI工作負(fù)載來驗(yàn)證數(shù)據(jù)中心集群組件,從而在數(shù)據(jù)中心實(shí)際部署前洞察系統(tǒng)設(shè)計(jì)性能,提高數(shù)據(jù)中心部署效率。

作為人工智能技術(shù)落地的重要基礎(chǔ)設(shè)施,大規(guī)模AI數(shù)據(jù)中心是一個(gè)復(fù)雜的系統(tǒng),計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)通信功能實(shí)現(xiàn)包含了芯片、電纜、互連、交換機(jī)、服務(wù)器和圖形處理單元(GPU)等硬件以及操作系統(tǒng)、驅(qū)動(dòng)程序等軟件,而讓信息流和任務(wù)流在所有硬件之間、軟件之間以及軟硬件協(xié)同地高效流動(dòng),考驗(yàn)著數(shù)據(jù)中心建設(shè)工程師智慧與能力。

為了避免被動(dòng)調(diào)整建設(shè)方案并提高部署效率,在工程設(shè)計(jì)階段面向組件級(jí)和系統(tǒng)級(jí)分別開展仿真驗(yàn)證,通過使用全棧工作負(fù)載仿真補(bǔ)充物理層測(cè)試,識(shí)別單獨(dú)測(cè)試組件時(shí)未發(fā)現(xiàn)的漏洞,客戶可以更快地提取峰值A(chǔ)I性能,更快地增加容量,最大化在AI集群上的投資回報(bào)。

日前,全球知名的測(cè)試測(cè)量企業(yè),是德科技整合了在網(wǎng)絡(luò)流量仿真、網(wǎng)絡(luò)組件、網(wǎng)絡(luò)合規(guī)驗(yàn)證以及最新行業(yè)標(biāo)準(zhǔn)方面的深厚經(jīng)驗(yàn),通過模擬、驗(yàn)證數(shù)據(jù)中心在AI計(jì)算、網(wǎng)絡(luò)、互連和能源效率等方面的性能,面向當(dāng)下火熱的AI數(shù)據(jù)中心建設(shè)需求,推出了全新KAI系列解決方案,旨在幫助數(shù)據(jù)中心迎接大帶寬、高速率的數(shù)據(jù)傳輸挑戰(zhàn)。

 1.jpg

  是德科技大中華區(qū)高速數(shù)字市場部經(jīng)理李堅(jiān)表示,是德科技對(duì)AI產(chǎn)業(yè)發(fā)展持非常樂觀的態(tài)度,AI該產(chǎn)業(yè)正處于成長期,AI數(shù)據(jù)中心網(wǎng)絡(luò)還存在很多的需要解決的問題,業(yè)界需要全面地從物理層到網(wǎng)絡(luò)層,憑借模擬真實(shí)環(huán)境的仿真系統(tǒng)來探尋解決問題的方法。

全新的KAI系列解決方案,可以幫助AI提供商、半導(dǎo)體制造商和網(wǎng)絡(luò)設(shè)備制造商均獲得創(chuàng)新能力。

2.png


據(jù)李堅(jiān)介紹,“KAI”是是德科技面向AI產(chǎn)業(yè)而推出的創(chuàng)新解決方案,旨在加速AI數(shù)據(jù)中心復(fù)雜系統(tǒng)的設(shè)計(jì)和部署,提高建設(shè)效率和降低成本。

首先是加速設(shè)計(jì)進(jìn)程,通過調(diào)試先進(jìn)的高速數(shù)字設(shè)計(jì),滿足或超過最新的PCIe、DDR和CXL等標(biāo)準(zhǔn)。

其次是加速系統(tǒng)開發(fā),驗(yàn)證組件級(jí)合規(guī)性,包括高速互連、電纜和芯片組,并在系統(tǒng)級(jí)層面驗(yàn)證工作負(fù)載性能。

第三可以加速部署和運(yùn)營,通過對(duì)整個(gè)數(shù)據(jù)中心驗(yàn)證和優(yōu)化系統(tǒng)級(jí)性能,使用端到端仿真在大規(guī)模部署前找出系統(tǒng)性能問題,降低工作負(fù)載失敗的風(fēng)險(xiǎn)。

是德科技此次推出的三款新產(chǎn)品可助力客戶應(yīng)對(duì)AI數(shù)據(jù)中心部署的行業(yè)挑戰(zhàn)。

KAI數(shù)據(jù)中心構(gòu)建器

AI服務(wù)提供商使用各種并行處理策略來加速AI模型訓(xùn)練,將模型并行與AI集群拓?fù)浜团渲脜f(xié)同可以提高訓(xùn)練性能。

AI網(wǎng)絡(luò)通信有兩個(gè)非常重要的特點(diǎn),一是節(jié)點(diǎn)之間要進(jìn)行大量的數(shù)據(jù)交換,每個(gè)神經(jīng)元之間,每個(gè)GPU之間在這個(gè)超級(jí)節(jié)點(diǎn)里都要進(jìn)行大量的數(shù)據(jù)交換;二是“突發(fā)”即在短時(shí)間里進(jìn)行大規(guī)模數(shù)據(jù)交換。如何通過軟件仿真真實(shí)的數(shù)據(jù)中心流量和通信特征,發(fā)現(xiàn)提高GPU和網(wǎng)絡(luò)利用效率系統(tǒng)部署方案,正是數(shù)據(jù)中心建構(gòu)工程師希望得到的“錦囊”。


3.png

李堅(jiān)表示,KAI數(shù)據(jù)中心構(gòu)建器的工作負(fù)載仿真解決方案可以再現(xiàn)真實(shí)AI訓(xùn)練任務(wù)的網(wǎng)絡(luò)通信模式,加速模型訓(xùn)練優(yōu)化所需的學(xué)習(xí)曲線,并更深入洞察性能下降的原因,這些是現(xiàn)實(shí)AI訓(xùn)練任務(wù)過程中難以獲得的。

KAI數(shù)據(jù)中心構(gòu)建器的工作負(fù)載模擬功能將大型語言模型(LLM)和其他人工智能(AI)模型訓(xùn)練所需要的工作負(fù)載集成到AI基礎(chǔ)設(shè)施組件的設(shè)計(jì)和驗(yàn)證中——包括網(wǎng)絡(luò)、主機(jī)和加速器,實(shí)現(xiàn)了硬件設(shè)計(jì)、協(xié)議、架構(gòu)和AI訓(xùn)練算法之間的更緊密協(xié)同,提升系統(tǒng)性能。

互連與網(wǎng)絡(luò)性能測(cè)試儀

一直以來,驗(yàn)證網(wǎng)絡(luò)互連性能需要手動(dòng)操作,耗費(fèi)大量時(shí)間,自動(dòng)化程度有限或根本無法實(shí)現(xiàn),該過程還缺乏一個(gè)集中系統(tǒng)來整理和存儲(chǔ)互連數(shù)據(jù)及報(bào)告,因此很難跟蹤和復(fù)制測(cè)試和配置。隨著AI和數(shù)據(jù)中心互連的多樣性和規(guī)模不斷增加,這些傳統(tǒng)測(cè)試方法無法準(zhǔn)確預(yù)測(cè)和衡量當(dāng)今復(fù)雜AI網(wǎng)絡(luò)的可靠性。

4.jpg


李堅(jiān)表示,新的互連和網(wǎng)絡(luò)性能測(cè)試系統(tǒng)通過INPT-1600GE搭配ITS軟件,可以作為一個(gè)整體系統(tǒng),智能地組織、存儲(chǔ)和使用數(shù)據(jù),實(shí)現(xiàn)高速以太網(wǎng)網(wǎng)絡(luò)和AI數(shù)據(jù)中心中的互連自動(dòng)化驗(yàn)證。

DCA-M采樣示波器

為了應(yīng)對(duì)高速數(shù)據(jù)傳播需求,業(yè)界普遍采用1.6T光互連解決方案,而該方案在AI數(shù)據(jù)中心網(wǎng)絡(luò)的快速部署帶來了顯著的測(cè)量挑戰(zhàn)。在制造過程中,自動(dòng)化測(cè)試必須高效、可擴(kuò)展且精確,以驗(yàn)證大量關(guān)鍵參數(shù),確保高吞吐量和產(chǎn)量,同時(shí)滿足數(shù)據(jù)中心要求并符合行業(yè)標(biāo)準(zhǔn)。

數(shù)據(jù)速率極高且信號(hào)完整性要求嚴(yán)格,工程師需要在廣泛的操作條件下對(duì)收發(fā)器的性能進(jìn)行表征和驗(yàn)證,這需要具有卓越帶寬、低噪聲和高靈敏度的精確測(cè)試設(shè)備。

5.jpg


據(jù)李堅(jiān)介紹,DCA-M采樣示波器提供高達(dá)224 Gbps/通道的高速光信號(hào)分析,專為滿足1.6T收發(fā)器光學(xué)測(cè)試的嚴(yán)格要求而設(shè)計(jì),具有高光學(xué)測(cè)量靈敏度和集成時(shí)鐘恢復(fù)功能,支持高達(dá)120 GBaud的數(shù)據(jù)速率,完全滿足數(shù)據(jù)中心AI集群的下一代光互連的研發(fā)和制造需求。

 

官方訂閱.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。