IT之家 6 月 3 日消息,在今日开幕的 Build 2026 开发者大会上,微软宣布在去年为 Edge 浏览器推出基于 Phi-4-mini 模型的写作辅助 API 基础上扩展了其端侧 AI 能力,新增了模型和 API。本次更新主要包括三项内容:
Aion-1.0-Instruct 小语言模型的开发者预览版(用于早期测试和反馈);
Edge 148 版本中由端侧任务专用模型驱动的语言检测和翻译 API;
以及在 Edge Canary 和 Dev 通道中提供的实验性 Web Speech API 端侧语音识别功能。

微软表示,过去一年中,Edge 浏览器的写作辅助 API 一直基于 Phi-4-mini 模型。这是一个 40 亿参数的模型,在文本理解、推理和指令遵循方面表现出色,但其硬件要求限制了它在不同设备上的可用性。
因此,微软即日起在 Edge Canary 和 Dev 通道中引入了 Aion-1.0-Instruct 小语言模型的开发者预览版。该模型更小、更快、更高效,可扩展到更多设备 —— 包括 GPU 性能较低的设备,以及通过 CPU 推理支持无 GPU 的设备,同时为广泛的 Web 使用场景提供良好的输出质量。
该预览版允许开发者在真实 Web 场景中评估 Aion-1.0-Instruct,测试 API 互操作性并提供反馈,该模型计划于 7 月以开源形式发布到 Hugging Face。
在 Edge 148 预览版中,全新的语言检测和翻译 API 已正式可用。这些 API 允许网站和浏览器扩展识别文本语言并在语言对之间进行翻译,基于端侧任务专用模型,支持 145 种以上语言,并针对 Web 翻译负载进行了优化。
开发者可以在网站或扩展中使用 JavaScript 调用这些 API,相比云服务,可获得更好的用户隐私、网络独立性以及零翻译成本。
在最新的 Edge Canary 和 Dev 通道中,微软还引入了处理语音的端侧任务专用模型,实现了 Web Speech API 的本地语音识别。该实现将语音转文字过程在用户设备上本地完成,可改善用户隐私、降低延迟,并支持低网络连接或无网络场景。开发者只需在现有 Web Speech API 代码中做少量修改,例如设置 recognition.processLocally = true,即可启用端侧语音识别。
微软表示,借助 Aion-1.0-Instruct 小语言模型、新的语言检测和翻译 API 以及端侧语音识别,开发者可以利用内置于浏览器的模型打造基于 AI 的 Web 体验,无需依赖专用硬件、云服务或特定领域专业知识。