小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini

4 月 30 日消息，小米大模型团队通过“Xiaomi MiMo”公众号宣布，今天，小米开源首个“为推理而生”的大模型 Xiaomi MiMo，联动预训练到后训练，全面提升推理能力。据介绍，MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。

在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 仅用 7B 的参数规模，超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

官方表示，MiMo 推理能力的提升，由预训练和后训练阶段中数据和算法等多层面的创新联合驱动，包括：

预训练：核心是让模型见过更多推理模式

数据：着重挖掘富推理语料，并合成约 200B tokens 推理数据。

训练：进行了三阶段训练，逐步提升训练难度，总训练 25T tokens。

后训练：核心是高效稳定的强化学习算法和框架

算法：提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题，并引入 Easy Data Re-Sampling 策略，以稳定 RL 训练。

框架：设计了 Seamless Rollout 系统，使得 RL 训练加速 2.29 倍，验证加速 1.96 倍。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

评论列表（1条）

stacer 2025年5月7日上午8:01

Google Chrome 130.0.0.0 Windows 10 x64 Edition
又赢麻了

回复

破碎狼魂 2026年7月25日

云盘下载速度怎么样

评论于迅雷17 v25.0.82.156 绿色精简版
闻道沐心 2026年7月25日

挺搞笑的，买个手机要护着不让骂，买个车要护着不让骂，玩个游戏要护着不让骂，如今，一个出生也要护着不让骂了，叹为观止

评论于 Notepad - - (文本编辑器) v3.8.2 官方版
a543 2026年7月25日

输入法？

评论于 Microsoft Edge v150.0.4078.96 离线安装包
56408656 2026年7月24日

最新版每次打开网站都要重新登录

评论于 360安全浏览器 v16.1.6088.64 优化便携版
Sumire 2026年7月24日

搞笑了是不，你这种滚刀肉不为了赢回我干什么呢？你不想长脑子没关系，反正给社区做贡献不缺你一个

评论于 Notepad - - (文本编辑器) v3.8.2 官方版
2303268293@qq.com 2026年7月24日

https://github.com/PLFJY/ContextMenuMgr 这上面1.7.2了

评论于 ContextMenuMgrPlus(右键菜单工具) v1.6.9 便携版
ghxb2 2026年7月24日

已重新上传

评论于 PicView(看图工具) v5.0.1
老K 2026年7月24日

融合版比杂交版稳定太多了没有闪退过。之前玩杂交版经常闪退体验感也有点腻，现在转战融合版

评论于植物大战僵尸融合版 v3.8.1
老K 2026年7月24日

融合版顾名思义，玩家需要手动将同种或者不同植物，融合拼接成更高属性或者多种属性的植物，比如2株单发豌豆二合一成1株双发豌豆。杂交版，玩家不需要手动融合，潜艇伟伟迷作者提前将植物杂交二合一了

评论于植物大战僵尸融合版 v3.8.1
1771545131 2026年7月24日

便携版的文件不存在

评论于 PicView(看图工具) v5.0.1

小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini - 果核剥壳

相关推荐

发表回复

评论列表（1条）