阿里發(fā)布Qwen3-Coder，為4800億參數(shù)開源代碼模型

2025-07-24 來源：愛集微原創(chuàng)文章

275

關(guān)鍵詞：阿里Qwen3-Coder 混合專家模型代碼強(qiáng)化學(xué)習(xí) 代理式編程開源模型

近日，阿里巴巴集團(tuán)正式發(fā)布了全新開源代碼模型 Qwen3-Coder，引起了廣泛關(guān)注。此次發(fā)布的 Qwen3-Coder-480B-A35B-Instruct（以下簡稱 Qwen3-Coder）是該系列中最強(qiáng)大的版本，擁有高達(dá)4,800億的總參數(shù)量和350億的激活參數(shù)，原生支持256K token的上下文，并可擴(kuò)展到1百萬token，支持358種編程語言。

Qwen3-Coder采用了混合專家（MoE）模型架構(gòu)，配備了96個(gè)查詢（Q）注意力頭和8個(gè)鍵/值（KV）注意力頭，擁有160個(gè)專家，其中8個(gè)專家被激活。在預(yù)訓(xùn)練階段，該模型從數(shù)據(jù)、上下文和合成數(shù)據(jù)三個(gè)角度進(jìn)行擴(kuò)展，以提升代碼能力；在后訓(xùn)練階段，研究團(tuán)隊(duì)通過在真實(shí)代碼任務(wù)上擴(kuò)展代碼強(qiáng)化學(xué)習(xí)（Code RL）訓(xùn)練，顯著提升了代碼執(zhí)行成功率。

值得一提的是，Qwen3-Coder在代理式編碼、代理式瀏覽器使用和代理式工具使用上達(dá)到了開源模型的領(lǐng)先水平，媲美Claude Sonnet 4。其代碼庫上線一小時(shí)便收獲了5.1k Star，足見其受歡迎程度。此外，阿里還推出了基于Qwen3-Coder的命令行工具Qwen Code，進(jìn)一步提升了其在代理式編程任務(wù)上的表現(xiàn)。

Qwen3-Coder的發(fā)布是阿里Qwen3系列模型的最新進(jìn)展。三個(gè)月前，阿里發(fā)布了Qwen3系列，包括兩款MoE模型和六款密集模型。其中的旗艦?zāi)Ｐ蚎wen3-235B-A22B，總參數(shù)量高達(dá)2,350億，激活參數(shù)為220億。此次發(fā)布的Qwen3-Coder取消了混合思維模式，專注于非思考模式，以獲得最佳質(zhì)量。

相關(guān)文章

行業(yè)動(dòng)態(tài)

道氏技術(shù)：年產(chǎn)1000噸硅碳負(fù)極項(xiàng)目已和恩平當(dāng)?shù)卣炗唴f(xié)議

聞泰科技重大資產(chǎn)出售進(jìn)展：多家公司股權(quán)已完成交割

馬斯克腦機(jī)公司Neuralink：已為全球12人植入芯片

熱讀文章

苗圩出席統(tǒng)籌推進(jìn)疫情防控和產(chǎn)業(yè)轉(zhuǎn)型升級促進(jìn)制造業(yè)通信業(yè)穩(wěn)定發(fā)展發(fā)布會(huì)

一圖讀懂2020年《政府工作報(bào)告》

工業(yè)富聯(lián)：擬7763萬美元收購鴻海精密美國子公司相關(guān)資產(chǎn)

日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

阿里發(fā)布Qwen3-Coder，為4800億參數(shù)開源代碼模型

阿里發(fā)布Qwen3-Coder，為4800億參數(shù)開源代碼模型