欧洲公司Mistral 发布首款融合模型 Medium 3.5:128B 参数超越Sonnet 4.5

欧洲公司Mistral 正式宣布推出融合模型 Mistral Medium 3.5。目前,该模型已开启公开测试,旨在通过高效的参数架构提供顶尖的推理、编程和多模态处理能力。 Mistral Medium 3.5 是一个拥有 128B 参数 的稠密模型,具备 256k 超长上下文窗口。与以往不同,它在...
欧洲公司Mistral 发布首款融合模型 Medium 3.5:128B 参数超越Sonnet 4.5
欧洲公司Mistral 发布首款融合模型 Medium 3.5:128B 参数超越Sonnet 4.5

欧洲公司Mistral 正式宣布推出融合模型 Mistral Medium 3.5。目前,该模型已开启公开测试,旨在通过高效的参数架构提供顶尖的推理、编程和多模态处理能力。

Mistral Medium 3.5 是一个拥有 128B 参数 的稠密模型,具备 256k 超长上下文窗口。与以往不同,它在单一权重组中融合了指令遵循、复杂推理和代码生成能力。尽管拥有性能,但该模型优化了显存占用,用户可以在少至 4 块 GPU 上实现自托管私有化部署。推理力度(Reasoning effort)现在支持按需配置。这意味着同一个模型既能秒回日常闲聊,也能在复杂代理任务(Agentic runs)中进行深度思考。Mistral 从零开始训练了全新的视觉编码器,能够完美处理各种纵横比和尺寸的图像。

根据官方发布的测试数据,Mistral Medium 3.5 在多项核心指标上表现良好,甚至超越了参数量更大的竞争对手:
​软件工程(SWE-Bench Verified): 取得 77.6% 的高分,领先于 Qwen3.5 (397B) 和 Devstral 2。​智能体任务(\tau^3-Telecom): 得分高达 91.4,​Collie 测试: 95.8(表现优于 Claude 系列及其他大模型)

Medium 3.5 是专门为长程任务设计的,” Mistral 团队表示,“它能可靠地调用多个工具并生成结构化输出,这使得 Vibe 中的异步云端代理真正具备了商用价值。

17775127055905358952726615933559
17775127224904347776817529187771

17775127321201495650806432181363

每百万输入 Token 价格为 1.5 美元,每百万输出 Token 价格为 7.5 美元。现已在 Hugging Face 上发布,采用修订版 MIT 许可证。

mistral.ai

Remote agents in Vibe. Powered by Mistral Medium 3.5. | Mistral AI

Introducing Mistral Medium 3.5, remote coding agents in Vibe, plus new Work mode in Le Chat for complex tasks.

huggingface.co

mistralai/Mistral-Medium-3.5-128B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

3 个帖子 - 3 位参与者

阅读完整话题

来源: linux.do查看原文