美東時(shí)間12月6日周三,谷歌正式向公眾發(fā)布新一代大語言模型(LLM)Gemini,,號稱谷歌迄今為止“最大,、也最全能的AI模型”,有高級推理能力,,回答難題時(shí)“考慮得更仔細(xì)”,。有別于其他公司LLM競品的是,谷歌強(qiáng)調(diào)Gemeni是最靈活的模型,,因?yàn)樗貌煌笮〉陌姹?,可以適用于各種生成式AI應(yīng)用。
其中,,最輕盈的版本Gemni Nano可以直接在智能手機(jī)上離線運(yùn)行,;相對而言更強(qiáng)大的版本Gemini Pro可以執(zhí)行多種任務(wù),將通過谷歌的類ChatGPT聊天機(jī)器人Bard,,為眾多谷歌AI 服務(wù)提供支持,,加持谷歌的Gmail,、Maps Docs和YouTube等服務(wù),;功能最強(qiáng)大的版本Gemini Ultra也是谷歌迄今打造的最強(qiáng)大LLM,主要為數(shù)據(jù)中心和企業(yè)應(yīng)用而設(shè)計(jì),。
谷歌旗下AI研究機(jī)構(gòu)DeepMind的產(chǎn)品副總裁Eli Collins稱,,Gemini的多樣性意味著,它“能夠在從移動(dòng)設(shè)備到大型數(shù)據(jù)中心的所有設(shè)備上運(yùn)行,?!彼硎荆雀柙缇拖M蛟斓男乱淮鶤I模型更像是樂于助人的合作者,,而不是一種智能的軟件,,Gemini讓谷歌距離這種遠(yuǎn)景又近了一步,。
32種行業(yè)指標(biāo)測試中 Gemini有30種遙遙領(lǐng)先GPT-4
現(xiàn)在Gemini只有英語版,谷歌將很快推出其他語言的版本,。谷歌CEO Sundar Pichai說,,Gemini代表了AI的新時(shí)代。最終,,Gemini將與谷歌的搜索引擎,、廣告產(chǎn)品、Chrome瀏覽器等更多產(chǎn)品結(jié)合,。
Gemini Nano手機(jī)電腦版周三可用 Gemini Pro支持Bard,、下周面向云客戶 Gemini Ultra明年推行
具體應(yīng)用時(shí)間表方面,從本周三起,,安卓系統(tǒng)開發(fā)人員可以注冊使用Gemini Nano版,,打造智能手機(jī)和電腦的Gemini支持App。谷歌稱,,Gemini可以立即在其旗艦手機(jī)Pixel 8 Pro上啟用,,實(shí)現(xiàn)諸如歸納電話錄音對話要點(diǎn)等新的生成式AI功能。
Gemini Pro版從本周三開始支持Bard,,實(shí)現(xiàn)高級的推理,、規(guī)劃、理解等功能,,在170個(gè)國家地區(qū)以英語一種語言操作運(yùn)行,,可能不包括英國或者其他歐洲地區(qū),因?yàn)楣雀璺Q在和當(dāng)?shù)氐谋O(jiān)管機(jī)構(gòu)合作,。
從12月13日下周三開始,,谷歌將通過谷歌云,在旗下Vertex AI 和 AI Studio平臺向云客戶提供 Gemini Pro版,。
Gemini Ultra將首先面向開發(fā)者和企業(yè)客戶開放,,該版本的應(yīng)用詳情將在下周公布。谷歌計(jì)劃,,明年初,,向公眾大范圍開放Gemini Ultra應(yīng)用。
谷歌還計(jì)劃,,明年初發(fā)布Gemini Ultra支持的進(jìn)階版Bard Advanced,,在面向大眾推出以前,先將推出一個(gè)測試項(xiàng)目,,以便改進(jìn)Bard Advanced,。
谷歌的下圖展示了Gemini家族三個(gè)版本。
谷歌此次毫不諱言和GPT-4一較高低的雄心,。發(fā)布Gemini前,,谷歌對它進(jìn)行了一系列以標(biāo)準(zhǔn)行業(yè)指標(biāo)評估的測試,。谷歌稱,在八項(xiàng)測試中,,Gemini Pro有六項(xiàng)的表現(xiàn)優(yōu)于OpenAI 的 GPT-3.5,。在通用語言理解、推理,、數(shù)學(xué)和編碼方面測試中,八項(xiàng)基準(zhǔn)指標(biāo)里,,Gemini 有七項(xiàng)超過了OpenAI 的最新版模型 GPT-4,。
同時(shí),谷歌評估了旗下可以解釋和生成代碼的最新生成式AI產(chǎn)品AlphaCode 2,,發(fā)現(xiàn)在競爭性編程領(lǐng)域,,它領(lǐng)先85%的競爭對手。
DeepMind的CEO Demis Hassabis稱,,谷歌運(yùn)行了32種完善的基準(zhǔn)指標(biāo)相關(guān)測試,,對比Gemini和GPT-4這兩個(gè)模型,既有諸如多任務(wù)語言理解這類廣泛的整體測試,,到生成Python代碼這種單一能力的測試,。32種基準(zhǔn)指標(biāo)種,Gemini有30項(xiàng)都“遙遙領(lǐng)先”,。
以下谷歌報(bào)告的截圖可見,,在多選問題、數(shù)學(xué)問題,、Python代碼任務(wù),、閱讀等方面,Gemini Pro和Ultra與GPT-4,、GPT-3.5等其他LLM的評分對比,。
Gemini為原生多模態(tài)模型 在谷歌更高性能云芯片TPU v5p訓(xùn)練
谷歌稱,Gemini是一種“原生多模態(tài)”AI模型,。這意味著它從一開始就經(jīng)過預(yù)先訓(xùn)練,,可以處理用戶基于文本和圖像的提示詞任務(wù),支持文本和圖像的服務(wù),。比如家長可以通過上傳數(shù)學(xué)問題的圖像,,以及在工作表里嘗試解決問題的照片,幫助孩子做家庭作業(yè),。Gemini還能閱讀答案,,理解為何是對的、為何是錯(cuò)的,,并解釋需要進(jìn)一步說明的概念,。
谷歌稱,,谷歌搜索運(yùn)用生成式AI技術(shù)的“搜索生成式體驗(yàn)”在明年融入和Gemini的新功能。
谷歌承認(rèn),,Gemini仍然可能存在AI產(chǎn)生的虛假信息或者捏造信息,。Collins 稱這是尚未解決的研究問題,不過他說,,Gemini有迄今為止谷歌AI模型的最全面安全評估,。為評估 Gemini 的安全性,谷歌對該模型進(jìn)行了對抗性測試,,模仿有不良企圖的用戶利用該模型輸入提示詞,,幫助研究人員檢查模型中是否存在仇恨言論和政治偏見。這類測試包括“真實(shí)毒性提示詞”,,它包含從網(wǎng)上提取的10萬多個(gè)提示詞,。
谷歌強(qiáng)調(diào)Gemini的AI工具效率會非常高、速度非???。它在谷歌自研的新版云芯片Tensor Processing Units(TPU)上訓(xùn)練,TPU v5p的性能更強(qiáng),,該芯片訓(xùn)練現(xiàn)有模型的速度比前代快2.8倍,。TPU v5p是為數(shù)據(jù)中心的訓(xùn)練和大模型運(yùn)行而設(shè)計(jì)。
谷歌機(jī)器學(xué)習(xí)副總裁 Amin Vahdat 表示,,這種方法讓谷歌“對未來標(biāo)準(zhǔn)AI基礎(chǔ)設(shè)施有了新的認(rèn)識”,。谷歌仍然使用第三方AI芯片運(yùn)行Gemini 模型。
谷歌提供的下圖可見,,谷歌數(shù)據(jù)中心內(nèi)成排的谷歌云TPU v5p AI 加速器超級計(jì)算機(jī),。