[分享发现] Fable/Mythos 一周试用:长任务智能体的跃迁,也带来了新的使用成本

Fable/Mythos 给人的核心判断很清楚:它不像一个更快的聊天模型,而更像一个更愿意接管复杂项目的长任务智能体。Matthew Berman 试用一周后的体验显示,它在大规模代码审查、并行代理调度和长期目标执行上明显前进一步;但与此同时,它也暴露出下一代模型常见的代价——慢、啰嗦、谨慎,以及高...
[分享发现] Fable/Mythos 一周试用:长任务智能体的跃迁,也带来了新的使用成本
[分享发现] Fable/Mythos 一周试用:长任务智能体的跃迁,也带来了新的使用成本

Fable/Mythos 给人的核心判断很清楚:它不像一个更快的聊天模型,而更像一个更愿意接管复杂项目的长任务智能体。Matthew Berman 试用一周后的体验显示,它在大规模代码审查、并行代理调度和长期目标执行上明显前进一步;但与此同时,它也暴露出下一代模型常见的代价——慢、啰嗦、谨慎,以及高 token 消耗。

https://blog.1001020.xyz/article/fable-mythos-week-review-long-horizon-agent

来源: v2ex查看原文