6 月 3 日消息,在今日盛大开幕的 Build 2026 开发者大会上,微软正式宣布对其 Edge 浏览器的端侧 AI 能力进行全面扩充。继去年为 Edge 引入基于 Phi-4-mini 模型的写作辅助 API 后,此次更新带来了更加高效的新模型与全新 API 接口。经本站梳理,本次更新主要包括:Aion-1.0-Instruct 小语言模型的开发者预览版;Edge 148 版本中全新推出的语言检测和翻译 API;以及在 Edge Canary 和 Dev 通道中新增的 Web Speech API 端侧语音识别功能。

回顾过去一年,Edge 的写作辅助功能主要依赖拥有 40 亿参数的 Phi-4-mini 模型。微软坦言,该模型在文本理解和逻辑推理上表现优异,但较高的硬件门槛限制了它在不同设备上的普及。为了解决这一痛点,微软即日起在 Edge Canary 和 Dev 通道中,正式放出了 Aion-1.0-Instruct 小语言模型的开发者预览版。这款新模型更加轻量高效,不仅能轻松适配低端 GPU 设备,还能通过 CPU 推理支持无 GPU 设备,同时在广泛的 Web 场景中保持极高水准的输出质量。微软鼓励开发者在真实场景中评估该模型并测试 API,据悉,该模型计划于今年 7 月在 Hugging Face 平台开源。
与此同时,伴随 Edge 148 预览版的发布,由端侧任务专用模型驱动的语言检测与翻译 API 也宣告正式可用。该模型针对 Web 翻译负载进行了深度优化,支持超过 145 种语言的互译。开发者现在只需使用 JavaScript 即可在网站或扩展中轻松调用。由于所有翻译均在本地进行,相较于云端服务,它为用户带来了更好的隐私保护、网络独立性以及零翻译成本。
在语音交互方面,微软在最新的 Edge Canary 和 Dev 通道里还引入了另一款端侧任务专用模型,实现了 Web Speech API 的本地语音识别。这项功能将“语音转文字”的计算彻底放在用户设备端完成,大幅降低了延迟,并完美支持弱网或无网环境。对于开发者而言,接入过程极其平滑,仅需在现有代码中做少量修改(例如设置 recognition.processLocally = true),即可激活端侧语音识别。
微软在大会上总结表示,借助 Aion-1.0-Instruct 模型、全新的本地翻译以及端侧语音识别 API,开发者将能够直接利用浏览器内置的模型,打造出革命性的 AI Web 体验,从此无需再依赖专用的硬件设备、云端服务或是复杂的 AI 领域专业知识。

微信扫一扫
支付宝扫一扫 