7 月 5 日消息,,正在進(jìn)行的 2024 世界人工智能大會(huì)(WAIC 2024)期間,智譜 AI 發(fā)布并開源代碼生成大模型 CodeGeeX 的第四代產(chǎn)品 CodeGeeX4-ALL-9B,,集代碼補(bǔ)全和生成,、代碼問答,、代碼解釋器、工具調(diào)用,、聯(lián)網(wǎng)搜索,、項(xiàng)目級代碼問答等所有能力于一體,,號稱是目前百億(10B)參數(shù)以下性能最強(qiáng)、最全能的代碼大模型,。
據(jù)介紹,,該模型在 GLM4 的語言能力的基礎(chǔ)上大幅增強(qiáng)了代碼生成能力。CodeGeeX4-ALL-9B 單一模型,,即可支持代碼補(bǔ)全和生成,、代碼解釋器、聯(lián)網(wǎng)搜索,、工具調(diào)用,、倉庫級長代碼問答及生成等功能,覆蓋編程開發(fā)的各種場景,,支持 300 + 編程語言,。
CodeGeeX4-ALL-9B 升級支持 128K 上下文,使其能夠處理和利用更長代碼文件,,甚至是項(xiàng)目代碼中的信息,,有助于模型更深入理解復(fù)雜和細(xì)節(jié)豐富的代碼?;诟L的上下文,,CodeGeeX4-ALL-9B 可以處理更復(fù)雜的項(xiàng)目級任務(wù),在輸入顯著變長的情況下,,依然能準(zhǔn)確回答不同代碼文件中的內(nèi)容,,并對代碼作出修改。
官方更稱,,CodeGeeX4-ALL-9B 是“目前唯一的”能實(shí)現(xiàn) Function Call 的代碼大模型。其在 Berkeley Function Calling Leaderboard 上進(jìn)行了全面的測試,,包括各種形式的函數(shù)調(diào)用,、不同的函數(shù)調(diào)用場景以及函數(shù)調(diào)用可執(zhí)行性的測試,在 AST 和 Exec 測試集中調(diào)用成功率超過 90%,。