8 月 9 日消息,阿里通義千問 Qwen2 開源家族迎來新成員 Qwen2-Math,共有 15 億參數(shù),、70 億參數(shù)和 720 億參數(shù)三個版本,,是基于 Qwen2 LLM 構(gòu)建、專門用于數(shù)學(xué)解題的語言模型,。
簡介
Qwen2-Math 是一系列基于 Qwen2 LLM 構(gòu)建的專門用于數(shù)學(xué)解題的語言模型,,其數(shù)學(xué)能力顯著超越了開源模型,甚至超過了閉源模型(如 GPT-4o),,官方希望為科學(xué)界解決需要復(fù)雜多步邏輯推理的高級數(shù)學(xué)問題做出貢獻,。
性能
團隊在一系列數(shù)學(xué)基準評測上評估了我們的數(shù)學(xué)專用模型 Qwen2-Math。在 Math 上的評測結(jié)果表明,,其最大的數(shù)學(xué)專用模型 Qwen2-Math-72B-Instruct 超越了最先進的模型,,包括 GPT-4o、Claude-3.5-Sonnet,、Gemini-1.5-Pro 和 Llama-3.1-405B,。
Qwen2-Math 指令微調(diào)模型
正開發(fā)多語言模型
從報道中獲悉,新模型系列 Qwen2-Math 專注于數(shù)學(xué)能力,目前僅支持英文,,團隊計劃推出支持英文和中文的雙語模型,,并且開發(fā)多語言模型。
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。