阿里通義千問(wèn)發(fā)布Qwen2-Math開(kāi)源AI模型-AET-電子技術(shù)應(yīng)用

阿里通義千問(wèn)發(fā)布Qwen2-Math開(kāi)源AI模型

通義千問(wèn)家族新成員數(shù)學(xué)能力超 GPT-4o

日期： 2024-08-09

來(lái)源：IT之家

關(guān)鍵詞： 通義千問(wèn) Qwen2-Math 阿里 Qwen2 語(yǔ)言模型

8 月 9 日消息，阿里通義千問(wèn) Qwen2 開(kāi)源家族迎來(lái)新成員 Qwen2-Math，共有 15 億參數(shù)、70 億參數(shù)和 720 億參數(shù)三個(gè)版本，是基于 Qwen2 LLM 構(gòu)建、專(zhuān)門(mén)用于數(shù)學(xué)解題的語(yǔ)言模型。

簡(jiǎn)介

Qwen2-Math 是一系列基于 Qwen2 LLM 構(gòu)建的專(zhuān)門(mén)用于數(shù)學(xué)解題的語(yǔ)言模型，其數(shù)學(xué)能力顯著超越了開(kāi)源模型，甚至超過(guò)了閉源模型（如 GPT-4o），官方希望為科學(xué)界解決需要復(fù)雜多步邏輯推理的高級(jí)數(shù)學(xué)問(wèn)題做出貢獻(xiàn)。

性能

團(tuán)隊(duì)在一系列數(shù)學(xué)基準(zhǔn)評(píng)測(cè)上評(píng)估了我們的數(shù)學(xué)專(zhuān)用模型 Qwen2-Math。在 Math 上的評(píng)測(cè)結(jié)果表明，其最大的數(shù)學(xué)專(zhuān)用模型 Qwen2-Math-72B-Instruct 超越了最先進(jìn)的模型，包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。

Qwen2-Math 指令微調(diào)模型

正開(kāi)發(fā)多語(yǔ)言模型

從報(bào)道中獲悉，新模型系列 Qwen2-Math 專(zhuān)注于數(shù)學(xué)能力，目前僅支持英文，團(tuán)隊(duì)計(jì)劃推出支持英文和中文的雙語(yǔ)模型，并且開(kāi)發(fā)多語(yǔ)言模型。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà)：010-82306118；郵箱：[email protected]。

阿里通義千問(wèn)發(fā)布Qwen2-Math開(kāi)源AI模型

日期： 2024-08-09

來(lái)源：IT之家

相關(guān)內(nèi)容