《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > OpenAI發(fā)布全新o1模型

OpenAI發(fā)布全新o1模型

開啟 AI 通用復(fù)雜推理新篇章,,模擬人類思考、處理問題
2024-09-13
來源:IT之家
關(guān)鍵詞: OpenAI AI模型 o1

9 月 13 日消息,OpenAI 傳聞中的“草莓”(Strawberry)AI 模型現(xiàn)已面世,,正式名稱為“o1”,,是該公司首款具備“推理”能力的模型,。

o1 和 o1-mini

OpenAI 表示對該模型進(jìn)行特殊訓(xùn)練,,能夠比人類更快地回答更復(fù)雜的問題。與之同時(shí)發(fā)布的還有 o1-mini,,一個(gè)更小,、成本更低的版本。

0.png

OpenAI 表示 o1 模型的發(fā)布,,是其邁向類人 AI 宏偉目標(biāo)的關(guān)鍵一步,。

IT之家注:o1 模型目前處于“預(yù)覽”階段,官方強(qiáng)調(diào)該模型相關(guān)開發(fā)尚處于初期階段,,相比較 GPT-4o 模型,,使用成本更高且速度更慢,但在編寫代碼和解決多步驟問題方面表現(xiàn)更為優(yōu)秀,。

價(jià)格

OpenAI 公司表示從今天起,,ChatGPT Plus 和 Team 用戶將可訪問 o1-preview 和 o1-mini,,而 Enterprise 和 Edu 用戶則將在下周初獲得訪問權(quán)限,。

0.png

OpenAI 表示計(jì)劃將 o1-mini 的訪問權(quán)限擴(kuò)展至所有 ChatGPT 免費(fèi)用戶,但尚未確定發(fā)布日期,。

開發(fā)者獲取 o1 的訪問權(quán)限成本相當(dāng)高昂:如果調(diào)用 API,,o1-preview 的輸入詞元(tokens)費(fèi)用為每百萬個(gè)成本 15 美元(IT之家備注:當(dāng)前約 107 元人民幣),輸出詞元費(fèi)用為每百萬個(gè) 60 美元(當(dāng)前約 427 元人民幣),。

0.png

相比之下,,GPT-4o 的輸入詞元費(fèi)用為每百萬個(gè) 5 美元(當(dāng)前約 35.6 元人民幣),輸出詞元費(fèi)用為每百萬個(gè) 15 美元(當(dāng)前約 107 元人民幣),。因此 o1 模型輸入詞元費(fèi)用提高了 2 倍,,輸出詞元費(fèi)用提高了 3 倍。 

訓(xùn)練方式

OpenAI 的研究負(fù)責(zé)人 Jerry Tworek 表示,,o1 采用了有別于當(dāng)前模型的訓(xùn)練方法,,并他并未透露具體細(xì)節(jié)。

他提到,,o1“采用了全新的優(yōu)化算法和專門為其定制的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,?!?/p>

報(bào)道稱 OpenAI 在訓(xùn)練 o1 模型中使用一種稱為強(qiáng)化學(xué)習(xí)(reinforcement learning)的技術(shù),來自行解決問題,,該技術(shù)通過獎(jiǎng)勵(lì)和懲罰來教導(dǎo)系統(tǒng),。隨后,o1 采用“思維鏈”來處理查詢,,類似于人類通過逐步推理來解決問題的方式,。

由于采用了這種新的訓(xùn)練方法,OpenAI 表示模型應(yīng)該會(huì)更加準(zhǔn)確,。

Tworek 表示:“我們不能說已經(jīng)解決了幻覺問題,,但至少從觀測的結(jié)果來看,這個(gè)模型產(chǎn)生的幻覺明顯減少”,。

o1 模型優(yōu)勢

o1 模型與 GPT-4o 的主要區(qū)別在于,,它能夠比前代更好地處理復(fù)雜的編程和數(shù)學(xué)問題,并能解釋其推理過程,,這是 OpenAI 所強(qiáng)調(diào)的,。

OpenAI 的首席研究官 Bob McGrew 表示:

這款模型在解答 AP 數(shù)學(xué)考試題目上的表現(xiàn)無疑比我更出色,而我大學(xué)時(shí)還輔修了數(shù)學(xué),。

他提到,,OpenAI 還讓 o1 參加了國際數(shù)學(xué)奧林匹克競賽的資格考試,GPT-4o 僅正確解決了 13% 的問題,,o1 模型能夠解決 83% 的問題,。

在名為 Codeforces 競賽的在線編程比賽中,這一新型模型達(dá)到了參賽者中的第 89 位,,OpenAI 聲稱該模型的下一次更新將在物理,、化學(xué)和生物學(xué)中的挑戰(zhàn)性基準(zhǔn)任務(wù)上表現(xiàn)“與博士生相當(dāng)”。

0.png

同時(shí),,o1 在許多領(lǐng)域的能力不及 GPT-4o,。它在世界事實(shí)知識(shí)方面的表現(xiàn)也不如后者。此外,,它不具備瀏覽網(wǎng)頁,、處理文件和圖像的能力。盡管如此,,該公司認(rèn)為它代表了一類全新的功能,。將其命名為 o1,意在表明“將計(jì)數(shù)器重置回 1”,。

0.png

0.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。