微软发布 Phi-4-Reasoning-Vision-15B 开源模型，能自主决定何时思考的小型多模态 AI

3 月 5 日消息，据微软官方开发者社区博客今日消息，微软发布了一款 Phi-4-Reasoning-Vision-15B 模型，这是一款视觉推理模型。

它结合了高分辨率视觉感知与选择性、任务感知的推理，使其成为 Phi-4 系列中首个同时实现“看得清楚”和“想得深入”的小语言模型（SLM）。

传统的视觉模型仅执行被动的感知 —— 识别图像中“有什么”。Phi-4-Reasoning-Vision-15B 更进一步，执行结构化、多步骤的推理：理解图像中的视觉结构，将其与文本上下文连接，并得出可操作的结论。这使开发者能够构建从图表分析到 GUI 自动化的智能应用。

该模型最关键的设计特征是其混合推理行为。它可以根据提示在“推理模式”和“非推理模式”之间切换：

当需要深度推理时（例如数学问题、逻辑分析）→ 启用多步推理链

当快速感知足够时（例如，OCR、元素定位）→ 直接输出以降低延迟

该模型最重要的应用领域之一，就是搭配计算机智能体使用。模型接收一个屏幕截图和自然语言指令后，可输出目标 UI 元素的标准化边界框坐标，其他智能体模型可以执行点击、滚动和其他交互。

以下是 Phi-4-Reasoning-Vision-15B 与其他模型在关键任务上的性能对比：

▲ 非推理模式

▲ 推理模式

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

365515 2026年6月8日

Adobe Photoshop 2026 (27.7.0.11) 特别版 - 果核剥壳这个版本怎么10个G啊

评论于 Adobe Photoshop 2026 (27.7.0.11) 特别版
mazha 2026年6月7日

功能很牛啊！

评论于 wenboShareClient(局域网共享系统) v1.9 绿色版
abcpanpan 2026年6月7日

+AIModel，没找到有AI模型啊。

评论于 Adobe Photoshop 2026 (27.7.0.11) 特别版
Sumire 2026年6月7日

Agent 直接解析 Markdown 肯定还是比私有 JSON 方便了

评论于思源笔记 v3.6.5 绿色版
路人甲 2026年6月7日

目前最新和测试版，某目录下存在易受攻击利用的已签名组件 Reg***.exe，52 分析帖 2111548，建议修改版暂时 ban 掉这几个程序

评论于 Bandizip(跨平台解压缩软件) v7.43 激活版
shuaiok1 2026年6月7日

这个Coodesker我试用过问题一大堆，推荐用腾讯桌面整理更好还免费，兼容第三方壁纸，有云便签和云文件夹，真是腾讯良心软件了，关键经过快10年的更新已超稳定，我是一直用并强烈推荐腾讯桌面整理。

评论于【惊奇软件】Coodesker(纯净桌面图标整理) v2.2.1.9
心间 2026年6月7日

实测可以，不过我直接下载的官方版本

评论于 Android GKD(自定义屏幕点击) v1.12.1
zyw3501 2026年6月6日

Chrome v149.0.7827.54 果核增强版---打开多网页时,地址栏不能并列显示.

评论于 Chrome v149.0.7827.54 果核增强版
Zcs1911 2026年6月6日

没有pro

评论于 Listary v6.3.5.94 修改版
shuaiok1 2026年6月6日

这个是真好用啊！强烈推荐！用了一年多，之前一直用的QTTabBar很好，但停更不稳定。试过所有类似的，都没QTTabBar好，直到Tablacus Explorer这款出来。一开始的版本很多问题，但能用，更新到现在已很好，也很稳定，强烈推荐！

评论于 Tablacus Explorer(标签文件管理器) v26.5.12 绿色版

微软发布 Phi-4-Reasoning-Vision-15B 开源模型，能自主决定何时思考的小型多模态 AI - 果核剥壳

相关推荐

发表回复