Claude Opus 4.6和4.7并没有那么神

Max已经开了快一个月了,官方正价Google渠道。前几周用的比较满,最近一周用的比较少了。 Opus 生成的内容 70% 是我比较满意的,剩下 30% 需要我改。说一说我总结下来的问题: 问题 一次性生成可以,修改文件会有严重的腐化问题,表现为文件越来越长,越来越冗余。冲突越来越多,我经常需要运行...
Claude Opus 4.6和4.7并没有那么神
Claude Opus 4.6和4.7并没有那么神

image

Max已经开了快一个月了,官方正价Google渠道。前几周用的比较满,最近一周用的比较少了。

Opus 生成的内容 70% 是我比较满意的,剩下 30% 需要我改。说一说我总结下来的问题:

问题

  1. 一次性生成可以,修改文件会有严重的腐化问题,表现为文件越来越长,越来越冗余。冲突越来越多,我经常需要运行一遍自洽检查让它降低文档的熵。
  2. 黑话太多了,尤其是4.7,经常用缩写,什么砍、收、翻的车,纠正不过来。
  3. 道德约束有点严重,让它研究个代理协议经常弹出来什么danger,这个 gpt 也会有。
  4. 思考时间过长,我经常布置完任务就去干别的事了,十分钟以后再来看一下。(当然这点gpt也是更胜一筹)

总结下来只能说勉强让我满意,Claude很少能提出来让我非常满意非常赞叹的答案,特别是在讨论一些深入的问题的时候,尤其是编程哲学方面和研究方面,需要我引导它朝着某个方向思考,而不是它自主进行的思考。不过有一点还是要赞叹一下,就是它在搞研究的时候默认画出来的实验图确实是夯爆了,显得很专业。类似于以下这种:

vsmlp

或许专业的佬能看出来我在研究什么东西,MLP替代,下一代神经网络(hhh,是不是看起来很有前景。

编程问题

我在编程方面有点自己的见地,当然或许是我半瓶水咣当。我觉得Claude Code对于不懂代码的人来说也许很夯,一句话就能生成一个像样的网页和App,但是对于我来说,代码质量、结构设计、模块划分,Claude Code默认写出来的代码远远算不上优秀,甚至只能说平庸。

用一个比喻会比较恰当,就是Claude Code写出来的项目,就像它的上下文,腐化腐化,直到无法维护。

3 个帖子 - 3 位参与者

阅读完整话题

来源: linux.do查看原文