阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507 - 果核剥壳

7 月 31 日消息,阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:

新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分,在代码能力测试 LiveCodeBench v6 中得分 66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著。

在写作(WritingBench)、Agent 能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。

更长的上下文理解,原生支持 256K tokens,可扩展至 1M tokens。

阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507

此外,新模型的思考长度(thinking length)也增加了,官方推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥它的潜力。

官方透露,目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源,其轻量体积可轻松实现消费级硬件的本地部署;同时,其也在 Qwen Chat 上同步上线了新模型。

如果您喜欢本站,点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你: 下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件,加群提示为修改者自留,非本站信息,注意鉴别

(2)
上一篇 2025年7月31日 上午9:53
下一篇 2025年7月31日 上午10:31

相关推荐

发表回复

评论问题之前,点击我,能帮你解决大部分问题

您的电子邮箱地址不会被公开。 必填项已用*标注