[问与答] 是我的幻觉吗,我为什么感觉国产模型现在真的很强, glm5.1
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
幻觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第2页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 47 篇相关文章 · 第 2 / 3 页
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的
之前还以为是我幻觉,跑了一下自我介绍前端,和以前风格完全不一样。 以前风格参考: 【深夜无聊图一乐】跑了国内外目前几乎所有主流大模型的自我介绍页面(Claude 4.7 好惊艳) 搞七捻三 缺少GLM5.1,所以没测试。 测试环境统一为Vscode Lim-Code编程插件(除了
有没有觉得现在claude更新后,变得真的蠢笨啊,我都不敢让它写代码了。幻觉非常严重。而且我是那种工作流比较重的,写代码前要读好几个文件,然后它就开始发昏了……我现在都基本只用codex了。白瞎我的MAX会员,想知道kimi-k2.6现在如何啊?想回国产了。 4 个帖子 - 3
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
token 变贵,上下文效果拉垮,很难察觉的致命幻觉。现在都不知道到底用啥模型了
上个月,我交给大模型几份报告,让它分析用户家庭符不符合签证办理条件,它只能给出前面男主人的分析结果,后面的女主人和儿子的情况完全被忘了。我想让大模型帮我填写一下签证申请表,结果它要么识别不了申请表的字段,要么就是填错了,根本没法用。 后面我研究了一下,简单来说就是,大模型在处理复