《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測試測量 > 解決方案 > 【探索前沿 測試為先】低電壓測試,,AI技術(shù)熱潮背后算力核心的重要支撐

【探索前沿 測試為先】低電壓測試,AI技術(shù)熱潮背后算力核心的重要支撐

2024-02-29
來源:泰克科技
關(guān)鍵詞: 泰克 AI AGI

  2023什么最火,?無疑是以ChatGPT為代表的AGI (通用人工智能)了,,甚至被稱之為第四次工業(yè)革命的推動者。比爾·蓋茨說,,“ChatGPT像互聯(lián)網(wǎng)發(fā)明一樣重要,,將會改變世界?!?/p>

  加速爆發(fā)的AI無處不在

  AI芯片和AI服務(wù)器 – 掀起大規(guī)模建設(shè)熱潮

  ChatGPT的強(qiáng)大讓很多人看到了AI所帶來的無限可能,,國內(nèi)外互聯(lián)網(wǎng)公司紛紛入場,掀起了建設(shè)大模型建設(shè)的熱潮,,一座座數(shù)據(jù)中心拔地而起,,高算力顯卡被炒到了天價,仍然一卡難求,。相關(guān)媒體數(shù)據(jù)顯示,,2023年全球最大的社交網(wǎng)絡(luò)公司購買了多達(dá)15萬塊NVIDIA GPU,而其它IT知名巨頭可能只拿到了5萬塊左右,。新年之初扎克伯格發(fā)文稱,,計劃年底前向英偉達(dá)再購買35萬個H100 GPU芯片,,從而使該公司的GPU總量達(dá)到約60萬個,。

  AI PC – 未來每個人擁有一個專屬自己的AI PC

  IDC預(yù)測,, AI PC在中國PC市場中新機(jī)的裝配比例將在未來幾年中快速攀升,將在2024年暴增到55%,,在2027年達(dá)到85%,。2024年將成為AI PC元年。

  2023年底,,聯(lián)想集團(tuán)與IDC聯(lián)合發(fā)布了首份《AI PC產(chǎn)業(yè)(中國)白皮書》,。出于數(shù)據(jù)安全和隱私保護(hù)的考慮,以及更高效率,、更低成本響應(yīng)用戶需求的考慮,,人們既希望獲得公共大模型強(qiáng)大的通用服務(wù),又希望AI能夠真正理解自己,、提供專屬個人的服務(wù),,并且能夠充分保障個人數(shù)據(jù)和隱私安全。未來,,每個個體都可以擁有一個專屬于自己的AI PC,,運行屬于自己的“個人大模型”。

  AI手機(jī) – AI+手機(jī)成為行業(yè)共識,,未來有望將手機(jī)行業(yè)帶入第三階段

  AI大模型的火熱,,也讓手機(jī)廠商看到了在軟件體驗上實現(xiàn)革新的可能。一方面,,AI的進(jìn)化有望提升智能手機(jī)的使用體驗,,另一方面跳出硬件互“卷”的怪圈,尋求新的競爭點,,現(xiàn)在“AI+手機(jī)”這一概念已經(jīng)成為了行業(yè)共識,。隨著三星新一代旗艦S24系列的正式發(fā)布,喊出“開啟移動AI新時代”的口號,,在新機(jī)中引入視頻AI處理,、AI聊天機(jī)器人、影像畫面處理,、通話實時翻譯等多項AI功能,,AI手機(jī)正式成為國內(nèi)外手機(jī)廠商共同的“進(jìn)化趨勢”。此前,,國內(nèi)手機(jī)的兩場發(fā)布會以及幾家公司的自演模型,,都非常默契地鎖定了AI能力在新手機(jī)和新系統(tǒng)上的落地。業(yè)界大佬稱,,2024 年是 AI 手機(jī)元年,,未來五年AI 對手機(jī)行業(yè)的影響,,完全可以比肩當(dāng)年智能手機(jī)替代功能機(jī)。AI 手機(jī)也將成為繼功能機(jī),、智能手機(jī)之后,,手機(jī)行業(yè)的第三階段。

  AI賦能汽車 – 繼家庭和辦公場所外的第三空間

  作為繼家庭和辦公場所之外的“第三空間”,,汽車正在變成一個新型智能終端,。ChatGPT到來了之后,車機(jī)關(guān)系也受到了更多的影響,。從整個參與的車企來看,,其發(fā)展大模型的方向和側(cè)重點并不相同。從功能上來看其主要可以分為以下兩類:

  • 一類是用于人工智能交流對話領(lǐng)域,,多數(shù)應(yīng)用在智能座艙上,。車載大模型語音助手,可以處理完整的對話,,如追問,,并能保持對前后文的理解,形成較為良好的語音交互體驗,。駕駛員未來有望通過車載系統(tǒng)完成預(yù)訂餐廳,、預(yù)訂電影票等任務(wù),極大地豐富智能汽車與人之間的交互體驗,。

  • 另一類是聚焦智能駕駛的大模型應(yīng)用,。幫助解決認(rèn)知決策問題,最終實現(xiàn)端到端的自動駕駛,;或者擺脫對高清地圖的依賴,,讓汽車做到更接近人類司機(jī)的駕駛表現(xiàn)。

  事實上,,AI 已經(jīng)無處不在,。在CES 2024上,我們看到了眼花繚亂的AI產(chǎn)品,。AI步行鞋幫助人們實現(xiàn)2.5倍步行速度,,AI地毯實時收集寵物健康和環(huán)境數(shù)據(jù),AI智能腰帶幫助盲人進(jìn)行環(huán)境監(jiān)測和路線導(dǎo)航,,AI 枕頭幫助用戶解決打鼾問題,,AI牙刷檢測刷牙習(xí)慣和牙齒健康并實時給出語音建議,AI鏡子會告訴你當(dāng)前的精神狀態(tài)并提供個性化建議,。2月中,,Open AI在文本模型ChatGPT、圖像模型Dall-E大殺四方后,,又祭出爆炸性的大殺器 - 視頻模型Sora,。Sora可以根據(jù)一段描述性文字生成長達(dá)一分鐘的視頻,。無論多天馬行空的想法,AI 都可以給你表達(dá)出來,,長達(dá)60秒,。業(yè)內(nèi)分析指出,這將對于廣告業(yè),、電影預(yù)告片,、短視頻行業(yè)帶來巨大的顛覆。

  AI背后的強(qiáng)大算力和通信芯片需要更低的工作電壓

  Sora也好,,ChatGPT也好,大模型訓(xùn)練的背后是由高算力芯片所組成的大規(guī)模運算網(wǎng)絡(luò),。Meta等巨頭一出手就是幾十萬個高算力芯片,,近千億的投資來建設(shè)數(shù)據(jù)中心。而作為終端的AI產(chǎn)品,,比如AI PC,、AI 手機(jī)、AI汽車,、AI智能家居,,依賴的就是終端產(chǎn)品內(nèi)的算力芯片。

  晶體管是芯片的基礎(chǔ)組成單元,,晶體管的數(shù)量越多,,芯片的性能越強(qiáng)。各大芯片設(shè)計廠家和晶圓廠,,就是想方設(shè)法在有限的空間里,,通過更小的工藝尺寸(如3nm),來堆積更多的晶體管,。

  晶體管工作的時候需要變化的電壓,,代表邏輯1和邏輯0,進(jìn)而實現(xiàn)計算或控制,。由于開關(guān)損耗,、短路功耗和漏電功耗的存在,晶體管在工作的時候會消耗掉電源功率,,產(chǎn)生熱量,。晶體管數(shù)量越來越龐大之后,散熱這個很現(xiàn)實的問題就擺在芯片和系統(tǒng)設(shè)計師的面前,。處理器芯片每平方厘米的面積上,,就能產(chǎn)生300瓦的峰值功率,算下是150瓦/平方厘米,,已經(jīng)超過了典型的核反應(yīng)堆的功率密度了?,F(xiàn)在的數(shù)據(jù)中心很多都已經(jīng)使用浸沒式液冷來進(jìn)行散熱,,把服務(wù)器和算力芯片浸沒在絕緣的、導(dǎo)熱性良好的液體里面,,通過液體的流動快速帶走熱量,,比傳統(tǒng)的風(fēng)扇散熱效率更高,但這還遠(yuǎn)遠(yuǎn)不夠,。

屏幕截圖 2024-02-29 133134.png

  圖1:  典型的8 x GPU算力系統(tǒng)(圖片來源NVIDIA)

屏幕截圖 2024-02-29 133220.png

  圖2: Chiplet封裝示意圖,,存儲單元可以多層堆疊而算力單元只能平鋪

  散熱和工藝尺寸一樣,是制約晶體管的密度和規(guī)模增加的難題之一,。解決散熱的其中一個方案,,就是從源頭想辦法,降低電壓,。使用更低的工作電壓,,將每一顆晶體管的功耗降下來,就可以堆疊更多的晶體管,。早期算力芯片工作電壓是5V,,慢慢演化到3.3V,1.8V,,1.5V,,如今,算力芯片和高速接口芯片的工作電壓基本都在1V左右,,甚至更低,。這就對電源設(shè)計和測量提出了更高的要求。

  低電壓條件下電源紋波和噪聲的測試挑戰(zhàn)與解決方案

  電源是算力芯片的能量來源,,是邏輯狀態(tài)的參考基準(zhǔn),。如果電源的紋波和噪聲過大,會給高速變化的邏輯信號上產(chǎn)生大量抖動,,進(jìn)而產(chǎn)生誤碼(注: 誤碼即錯誤的碼元,, 將邏輯1當(dāng)成邏輯0, 或者將0當(dāng)成1),影響芯片的性能,,甚至導(dǎo)致芯片無法正常工作,。高速信號驗證中非常重要的隨機(jī)抖動和低頻的周期性抖動,就是由于電源的噪聲和紋波所引入的,。

屏幕截圖 2024-02-29 133245.png

  圖3: 電源紋波和噪聲

  電源的紋波和噪聲測量,,一直都是電源工程師們最關(guān)注的問題之一。算力芯片更低的工作電壓,,導(dǎo)致電源留給紋波和噪聲的裕度變得更小了,,給設(shè)計和測試都帶來了難題。設(shè)計上,,算力芯片普遍采用POL的降壓方式,,將DC-DC變壓器盡可能靠近負(fù)載端,,可以有效避免傳輸鏈路上引入的外部干擾。測試上,,使用更高精度,、更低底噪的示波器,和專用的電源紋波探頭,,降低測量系統(tǒng)引入的噪聲,,才能更準(zhǔn)確地測量電源紋波和噪聲。

  泰克的MSO6B系列示波器的底噪性能非常優(yōu)異,,底噪的有效值在20MHZ帶寬下低至8.68uV,,1G帶寬下低至51.5uV,是測量電源紋波和噪聲的最佳選擇,。如果電源電壓是1V,,示波器的底噪稍微高一點,裕量還有很大空間,,是可行的嗎?這里需要了解兩個問題:

  1.儀器的底噪指標(biāo)用的都是有效值,。而電源紋波和噪聲的測量規(guī)范,,一般都是用峰峰值。峰峰值和測量樣本數(shù)相關(guān),,測量的樣本數(shù)越多,,峰峰值越大,我們可以近似的認(rèn)為峰峰值是有效值的10倍以上,。

  2.電源工程師測量底噪和紋波都會使用探頭,,而探頭會引入額外的底噪。為什么一定要用探頭呢,?有幾個方面的原因,,一是探頭使用便捷,二是探頭提供較高的輸入阻抗,,對待測電路的影響小,,三是探頭提供較大的偏置電壓,可以在測量噪聲和紋波的同時,,觀察到電源直流電壓的變化,。尤其當(dāng)芯片的負(fù)載處于動態(tài)變化時,電源的直流電壓也會隨之改變,。

  示波器加上探頭,,再去測量一下底噪的峰峰值,你會發(fā)現(xiàn)原來底噪并不小,。手上有示波器和探頭的工程師不妨試試看,,將示波器接上探頭,,不接任何待測信號。在示波器上打開峰峰值測量,,測量結(jié)果就是系統(tǒng)底噪,。

  常規(guī)的示波器和探頭,系統(tǒng)底噪峰峰值在5 mV以上,。而有些算力芯片和通信芯片,,要求電源噪聲的峰峰值必須小于3 mV。測量系統(tǒng)的底噪都這么大,,測量結(jié)果怎么可能Pass呢,!

  為了更準(zhǔn)確的測量電源紋波和噪聲,泰克推出了專用的電源軌探頭TPR系列,,20MHZ帶寬下的底噪的峰峰值(注意是峰峰值) 低至 300uV,,即便在4GHZ的全帶寬下,底噪的峰峰值依然只有1.3 mV,。而且TPR探頭還支持高達(dá)60V的偏置電壓,,多種多樣的探頭附件,不僅測得準(zhǔn),,用起來還很方便,。




更多精彩內(nèi)容歡迎點擊==>>電子技術(shù)應(yīng)用-AET<<

f9631f7c14ea0e385bff33971bcc059.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。