微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型：10 倍吞吐量，推理能力升级

7 月 11 日消息，科技媒体 NeoWin 昨日（7 月 10 日）发布博文，报道称微软推出 Phi-4-mini-flash-reasoning 小语言模型，重点提升端侧 AI 模型的数学和逻辑推理能力。

Phi-4-mini-flash-reasoning 的主要优势在于，它能够在边缘设备、移动应用和嵌入式系统等资源不足的场景下，引入先进的推理功能。

在架构方面，Phi-4-mini-flash-reasoning 创新引入了 SambaY 架构，而该架构的一大亮点，就是名为 Gated Memory Unit（GMU）的组件，它能够高效地在模型的内部之间共享信息，从而提高模型的效率。

这些改进让模型能够更快地生成答案和完成任务，即使面对非常长的输入也能应对自如，Phi 模型还能处理大量数据，理解非常长的文本或对话。

在性能方面，相比较其它 Phi 模型，Phi-4-mini-flash-reasoning 的吞吐量最高提升 10 倍，这意味着在给定的时间内，Phi-4-mini-flash-reasoning 可以完成更多的工作。

它可以在相同的时间内处理 10 倍多的请求或生成 10 倍多的文本，这对于实际应用来说是一个巨大的改进，此外，延迟也降低至其它 Phi 模型的 1/2~1/3。附上相关性能数据如下：

Phi-4-mini-flash-reasoning 新型模型已在 Azure AI Foundry、NVIDIA API Catalog 和 Hugging Face 上线。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

破碎狼魂 2026年7月25日

云盘下载速度怎么样

评论于迅雷17 v25.0.82.156 绿色精简版
闻道沐心 2026年7月25日

挺搞笑的，买个手机要护着不让骂，买个车要护着不让骂，玩个游戏要护着不让骂，如今，一个出生也要护着不让骂了，叹为观止

评论于 Notepad - - (文本编辑器) v3.8.2 官方版
a543 2026年7月25日

输入法？

评论于 Microsoft Edge v150.0.4078.96 离线安装包
56408656 2026年7月24日

最新版每次打开网站都要重新登录

评论于 360安全浏览器 v16.1.6088.64 优化便携版
Sumire 2026年7月24日

搞笑了是不，你这种滚刀肉不为了赢回我干什么呢？你不想长脑子没关系，反正给社区做贡献不缺你一个

评论于 Notepad - - (文本编辑器) v3.8.2 官方版
2303268293@qq.com 2026年7月24日

https://github.com/PLFJY/ContextMenuMgr 这上面1.7.2了

评论于 ContextMenuMgrPlus(右键菜单工具) v1.6.9 便携版
ghxb2 2026年7月24日

已重新上传

评论于 PicView(看图工具) v5.0.1
老K 2026年7月24日

融合版比杂交版稳定太多了没有闪退过。之前玩杂交版经常闪退体验感也有点腻，现在转战融合版

评论于植物大战僵尸融合版 v3.8.1
老K 2026年7月24日

融合版顾名思义，玩家需要手动将同种或者不同植物，融合拼接成更高属性或者多种属性的植物，比如2株单发豌豆二合一成1株双发豌豆。杂交版，玩家不需要手动融合，潜艇伟伟迷作者提前将植物杂交二合一了

评论于植物大战僵尸融合版 v3.8.1
1771545131 2026年7月24日

便携版的文件不存在

评论于 PicView(看图工具) v5.0.1

微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型：10 倍吞吐量，推理能力升级 - 果核剥壳

相关推荐

发表回复