opus 4.8真的那么差劲吗?还是我已经失去了对模型水平感知的能力?

如题。 手上的Opus 4.8是AWS源头渠道 GPT是team轮换+gopay plus,家宽环境juice值 512 我手上有五个项目并行开发 同时,我还用两款ai处理我的日常案件以及合同,给我的团队做中转也让他们参与评价,但都是些用智合就觉得够了的人( 我还玩一点airp 从4.6一直用到现在...
opus 4.8真的那么差劲吗?还是我已经失去了对模型水平感知的能力?
opus 4.8真的那么差劲吗?还是我已经失去了对模型水平感知的能力?

如题。
手上的Opus 4.8是AWS源头渠道
GPT是team轮换+gopay plus,家宽环境juice值 512

我手上有五个项目并行开发

同时,我还用两款ai处理我的日常案件以及合同,给我的团队做中转也让他们参与评价,但都是些用智合就觉得够了的人(

我还玩一点airp

从4.6一直用到现在,体感可以说和论坛里的大趋势违背较多,赞同较少。具体而言:

  1. 软件开发上,我认为现在opus 4.8和gpt 5.5是打平了的能力。特别从我桌面管理软件重构出发,从tauri改到现在一个超级冷门并且极致追求性能的技术栈,原先的tauri就是opus 4.6一遍出的,重构交给gpt 5.5,写的一塌糊涂。最近拿给4.8跑了52个小时,终于像了点样子。

  2. 合同审理上,要分成几个阶段。我的记忆里,4.6和5.5并存过一段时间,那个时候5.5明显在指令遵循以及文风上好过4.6,带来的效果是搜索的面更广,更能爬取到原文,出的合同不罗嗦更简洁,其他律师更赞成这点。

4.7是个区就不说了

来到4.8,目前的啰嗦语病仍然没有更改,在harness以及我的skills约束下,4.8在思考维度以及批判性上更能给出贴合建议,并且语法上较之4.6有了更大改善,逻辑更加严密,并且论证更加清晰。

  1. airp上,4.6沿袭了4.5的阳光正面开朗的脾性,对于剧情拓展上一如既往地烂,困在一个场景或者一段内容中反反复复来回,并且繁复的描写和语病加重了阅读4.6文字的心智负担。来到4.8情况明显好了太多,除去阳光正面开朗,我最看重的剧情拓展明显更加自由并且开放,同时描写上很少在毛线头上作文章,更像个百斤儿人了就是。

综上,我真的不是很理解为什么论坛清一色地给4.8差评,搞得我现在在实际使用过程中总是摇摆不定 :melting_face:

法律的事情还好说,我能拍板。但代码的事情就有点麻烦。特别是我打算投入学习的逆向,使用哪种模型作为教师,会给我带来不同的成本时间压力,以及面的广度深度。

还是想把自己的体会向论坛分享一下,看看究竟如何

15 个帖子 - 8 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文