《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > DeepSeek超越ChatGPT,登頂蘋果美國區(qū)免費(fèi)APP下載排行榜

DeepSeek超越ChatGPT,,登頂蘋果美國區(qū)免費(fèi)APP下載排行榜

2025-01-27
來源:新浪
關(guān)鍵詞: Deepseek

1月27日,,Deepseek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT,。

012701.jpg

蘋果美國區(qū)應(yīng)用商店

012702.jpg

蘋果APP Store中國區(qū)免費(fèi)榜

  Deepseek來自國產(chǎn)大模型公司深度求索,,系量化巨頭幻方量化旗下大模型公司。1月20日,,該公司正式發(fā)布推理大模型DeepSeek-R1,。一經(jīng)推出,DeepSeek-R1便憑借其“物美價(jià)廉”的特性在海外開發(fā)者社區(qū)中引發(fā)了轟動(dòng),。

  作為一款開源模型,,R1在數(shù)學(xué)、代碼,、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版,,并采用MIT許可協(xié)議,支持免費(fèi)商用,、任意修改和衍生開發(fā)等,。目前,在國外大模型排名榜Chatbot Arena上,,DeepSeek-R1的基準(zhǔn)測試排名已經(jīng)升至全類別大模型第三,,與OpenAI的ChatGPT-4o最新版并列,并在風(fēng)格控制類模型(StyleCtrl)分類中與OpenAI的o1模型并列第一,。

  更令市場驚訝的是,,據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,,在2048塊英偉達(dá)H800 GPU(針對(duì)中國市場的低配版GPU)集群上運(yùn)行55天完成,,僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。DeepSeek表示,,R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,,極大提升了模型推理能力。此外,,DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開,,還蒸餾了6個(gè)小模型向社區(qū)開源,允許用戶借此訓(xùn)練其他模型,。

  英偉達(dá)高級(jí)研究科學(xué)家Jim Fan表示,,DeepSeek-R1可能是“首個(gè)展示了RL(強(qiáng)化學(xué)習(xí))飛輪可以發(fā)揮作用且能帶來持續(xù)增長的OSS(開源軟件)項(xiàng)目”。其中,,“飛輪”用來形容AI系統(tǒng)中自我強(qiáng)化,、正向循環(huán)的過程。DeepSeek的論文顯示,,不同于過去AI模型往往依賴于監(jiān)督微調(diào)(SFT,,指AI模型通過已標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練),R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng),,證明了直接強(qiáng)化學(xué)習(xí)是可行的,。

  Jim Fan寫道:“我們正處于一個(gè)奇特的時(shí)間線上,一家非美國公司正在踐行OpenAI最初的使命,,即實(shí)現(xiàn)真正開放的前沿研究并讓所有人受益,。這種情況簡直無法理解,。最有娛樂性的結(jié)果卻是可能性最大的結(jié)果,。”


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。