《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 商湯絕影行業(yè)首發(fā)原生多模態(tài)大模型車端部署

商湯絕影行業(yè)首發(fā)原生多模態(tài)大模型車端部署

80 億參數(shù),、每秒 40 Tokens
2024-07-20
來源:IT之家

 7 月 19 日消息,商湯科技聯(lián)合創(chuàng)始人,、首席科學家王曉剛 17 日宣布,,商湯絕影在行業(yè)內(nèi)率先實現(xiàn)了原生多模態(tài)大模型的車端部署,。車載端側(cè) 8B 模型首包延遲在 300 毫秒以內(nèi),推理速度 40 Tokens / 秒,,覆蓋主流算力平臺,。

0.png

商湯絕影為多模態(tài)大模型打造計算引擎“HyperPPL”,目前擴展并支持主流車載計算硬件,,兼容多種主流操作系統(tǒng),,適配多個車載芯片的部署平臺,。

商湯絕影稱 HyperPPL 針對車載多人場景進行優(yōu)化,使得車內(nèi)多人并發(fā)情況下,,車端多模態(tài)大模型的模型推理效率相比單人沒有明顯降低,。

據(jù)IT之家此前報道,商湯絕影此前表示,,深圳首條自動駕駛公交線路采用其車輛與技術(shù),,所有駕駛操作都無需人員介入。

明年上千 TOPS 算力的車載芯片(英偉達 Thor)就會問世,?;诟咚懔Φ挠嬎闫脚_,商湯預(yù)計絕影多模態(tài)大模型車端部署方案的首包延遲將大幅降低,,推理速度進一步提高。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。