2016年才成立的斯洛伐克創(chuàng)業(yè)公司Tachyum今天拋出一枚重磅炸彈,,宣布了全新的128核心Prodigy處理器,,號(hào)稱“性能可超越Intel最快的至強(qiáng),,同時(shí)功耗僅有十分之一”。
首先說(shuō)一下Tachyum的背景:這家公司設(shè)立在斯洛伐克,,并得到過(guò)斯洛伐克政府1700萬(wàn)美元投資,,但幾位創(chuàng)始人都是美國(guó)人,且大有來(lái)頭,。
尤其是CEO Radoslav Danilak,,擁有25年的半導(dǎo)體行業(yè)經(jīng)驗(yàn),一度大紅大紫的SSD主控巨頭SandForce就是他創(chuàng)立的,,還親自擔(dān)任CEO,,后被希捷收購(gòu),后來(lái)又創(chuàng)立了Skyera,,繼續(xù)研究SSD主控技術(shù),,2014年又被西數(shù)收購(gòu)。
Tachyum Prodigy號(hào)稱是全球第一顆“通用處理器”(universal processor),,因?yàn)樗趩为?dú)一顆硅片內(nèi),,集成了通用目的處理器、高性能計(jì)算,、AI人工智能,、DML深度機(jī)械學(xué)習(xí)、可解釋人工智能(Explainable AI),、生物人工智能(Bio AI)等等,,基于并行多處理器環(huán)境,,可簡(jiǎn)化編程模型和環(huán)境。
最新的頂級(jí)型號(hào)為Prodigy T6128,,單路單芯片集成128個(gè)物理核心,,亂序執(zhí)行架構(gòu),每時(shí)鐘周期4條指令,,支持64位尋址、512位矢量操作,、AI/ML矢量和矩陣乘法加速,、虛擬化、高級(jí)RAS,,運(yùn)行頻率最高4GHz,。
緩存方面,每個(gè)核心32KB一級(jí)指令緩存,、32KB一級(jí)數(shù)據(jù)緩存,,均支持ECC,末級(jí)緩存共享64MB,,支持DECTED ECC,。
內(nèi)存方面,支持12個(gè)通道的DDR4,、DDR5,,最高頻率DDR5-4800,,但每通道只能有一條內(nèi)存條,,單條最大容量512GB,合計(jì)最大6TB,,并支持高級(jí)糾錯(cuò)和RAS。
IO方面,,集成了多達(dá)36個(gè)PCIe 5.0控制器,最多48條通道,同時(shí)還集成了兩組400G(40萬(wàn)兆)以太網(wǎng)控制器,。
更驚人的是,,所有這些強(qiáng)大的規(guī)格,在臺(tái)積電7nm工藝的加持下,,封裝面積才不過(guò)85×85平方毫米,略大于Intel LGA2066的酷睿,,但小于AMD SP3的線程撕裂者,。
Tachyum沒(méi)有披露Prodigy的具體架構(gòu),不知道基于RISC-V,、MIPS,、ARM還是自研,只是說(shuō)無(wú)論單線程還是多線程應(yīng)用,,都已經(jīng)超越了Intel至強(qiáng),,但是又比ARM更小巧,。
據(jù)介紹,,Prodigy T6128處理器適合大規(guī)模超級(jí)計(jì)算機(jī),、大數(shù)據(jù),、大型AI應(yīng)用,可提供262TFlops AI訓(xùn)練和推理性能,、16TFlops HPC高性能計(jì)算性能。
開(kāi)發(fā)環(huán)境方面,,Tachyum也提供了一系列工具,,包括FPGA模擬器、軟件模擬器,、二進(jìn)制翻譯器,、C/C++/Fortran編譯器、調(diào)試器和配置文件,、TensorFlow編譯器,,都在Linux操作系統(tǒng)下。
如果客戶不需要128核心這么高大上的規(guī)格,,Tachyum也提供64/32/24/16核心等不同配置,。
64核心的有兩款型號(hào),一個(gè)是T864,,支持八通道DDR4/DDR5內(nèi)存,、72條PCIe 5.0通道、兩組400G以太網(wǎng),、兩組HBM3(可選),、32MB完全一致性二級(jí)/三級(jí)緩存,運(yùn)行頻率4GHz,,核心電壓0.8V,,熱設(shè)計(jì)功耗180W,核心面積290平方毫米,,封裝面積66×66平方毫米,,可以取代單路/雙路的至強(qiáng)E7、至強(qiáng)E5,。
另一個(gè)是TH24,,專供AI/HPC,,四通道DDR5和/或32GB HBM3,后者可作為緩存也可以是獨(dú)立內(nèi)存,,需要高精密水冷。
32核心的型號(hào)為T432,,四通道DDR4,32條PCIe 4.0,兩組100G以太網(wǎng),。16核心的則是T216,,雙通道DDR4,32條PCIe 4.0,,兩組50G以太網(wǎng),。二者都是小尺寸封裝,成本和價(jià)格低廉,,適合取代至強(qiáng)E5,、至強(qiáng)E3、至強(qiáng)D系列,。
當(dāng)然,,這些產(chǎn)品大部分都還在紙面上,目前只流片成功了64核心的T864,,預(yù)計(jì)今年內(nèi)投入量產(chǎn),。