此前在 OpenRouter 的神秘模型 “Elephant Alpha”,其真身终于揭开了面纱。
这款在 OpenRouter 上的 Elephant Alpha 模型,现已正式确认为 inclusionAI 研发的 Ling-2.6-flash。
Ling-2.6-flash 是一款专为真实世界 Agent(智能体)设计的混合专家模型(MoE,总参数 104B,但在推理时仅需 7.4B 激活参数。 针对需要快速响应、强执行力和高 Token 效率的场景进行了深度优化。在保持极高响应速度的同时,能够显著降低开发者的使用成本并提升系统吞吐量。
根据Benchmark,Ling-2.6-flash 在多项关键测试中表现强劲,甚至超越了规模更大的非推理模型:在 TAU2-Telecom(电信智能体测试)中取得了 93.86 的惊人高分,远超 Nemotron 和 GLM 4.5 Air等竞品。 在 Multi-IF (turn-3) 和 MRCR (16K-256K) 测试中表现优异,充分证明了其在大规模上下文处理中的稳定性。
为了庆祝模型发布,Ling-2.6-flash 将在 OpenRouter 上开启为期 一周的限时免费体验。

Ling-2.6-flash (free) - API Pricing & Providers
Ling-2.6-flash is an instant (instruct) model from inclusionAI with 104B total parameters and 7.4B active parameters, designed for real-world agents that require fast responses, strong execution, and high token efficiency. $0 per million input...
9 个帖子 - 9 位参与者