如题kartoffeln又是那家国模?
我昨天晚上在竞技场刷3flash刷了几十次,发现kartoffeln在竞技场(arena.ai)code模式中出现的概率挺高的,效果貌似也不错,稳定性可以,基本不会有运行失败问题,主要是他的自我认知是claude,而且claude好像也不竞技场上匿名模型吧?
而且这个思维链不对,它思维链里认为自己是claude,但是claude4.6开始就是思维链摘要不是像这种原生思维链,而且好像还是英文,但这个会根据提示词语言换语言应该不是claude的:

而且生成出的HTML效果质量和claude4.7不太一样:
kartoffeln:https://019df293-57c8-7d74-adb8-e473805217b8.arena.site/
claude-opus-4-7-thinking:https://019df2a5-0da2-716e-87f7-4864b4bcfbb4.arena.site/
不知道是glm还是Kimi还是Minimax?
下面放一些kartoffeln和claude-opus-4-7-thinking还有gemini-3-flash(新flash版本未知,性能和稳定性比3.1Pro强)做的网页链接:
kartoffeln:https://019df2b9-b7d2-734d-91c4-df4ace534c8f.arena.site/
claude-opus-4-6:https://019df2b9-b7d2-73bc-b0a9-016681175738.arena.site/
deepseek-v4-pro:https://019df2a5-0da2-784a-aa4e-2795fe935634.arena.site/
(不知道哪里问题
也认为自己是claude,提示词里也没有提到)

kartoffeln:https://019def20-a07f-7f18-b026-bb397999e252.arena.site/
kartoffeln:https://019def20-6691-70c9-ad24-e4e22d270b2b.arena.site/

kartoffeln:https://019def0e-8d80-7b85-84cb-afc973419a39.arena.site/

claude-opus-4-6:https://019def1f-d6c3-76d5-b211-f2e7bc6182a0.arena.site/
kartoffeln:https://019def0e-585f-7066-9115-81b96eb44293.arena.site/
kartoffeln:https://019def0e-26e1-79f2-84ca-4fe247541068.arena.site/
kartoffeln:https://019deee7-fe2c-72ef-b454-e3a9530ef90c.arena.site/
claude-opus-4-7:https://019def0e-8d80-7c7a-b4b5-5afd1c673414.arena.site/
kartoffeln:https://019deee7-ba3e-7253-97a7-1478896b0038.arena.site/
kartoffeln:https://019deee7-5922-7fe6-8163-c0e40ccaff86.arena.site/
claude-opus-4-7:https://019deee7-5922-77a3-b4cc-60fb93c61fb1.arena.site/

claude-opus-4-7-thinking:https://019deeb3-0f38-71c7-af8c-3c25d0082f36.arena.site/

claude-opus-4-7-thinking:https://019dee8c-d089-7a74-ae0b-f486affad6ce.arena.site/

gpt-5.4-high:https://019deebc-e152-728c-88df-86dd161ee5db.arena.site/
gemini-3.1-pro-preview:https://019deee7-ba3e-7813-898e-2e6d33864f1e.arena.site/
gemini-3.1-pro-preview: https://019deec8-401e-7a62-856b-b54eb5034e89.arena.site/
deepseek-v4-pro-thinking:https://019deeb3-4884-7a0b-aa23-c6db0e6ae1bc.arena.site/
deepseek-v4-flash-thinking:https://019deeb3-4884-74d4-a9d5-95344351ad09.arena.site/
gemini-3-flash:https://019dee8d-4bb4-7d98-b7d2-1e246dc7bdf1.arena.site/
gemini-3-flash:https://019dedd2-7331-77b6-9d3d-6f71cca7dfda.arena.site/

gemini-3.1-pro-preview:https://019dedd4-af64-7030-8a03-089c10bbd1a2.arena.site/

claude-opus-4-7-thinking:https://019dedd4-af64-7ea5-b859-59e77f93faa0.arena.site/

gemini-3-flash:https://019dedca-cd40-7415-bf19-f61a247b1a09.arena.site/


kartoffeln:https://019ded8f-4c8e-7e21-bbc8-3e9662b173e7.arena.site/



gpt-5.5:https://019ded83-89be-7424-b222-10a93efd1c71.arena.site/
kartoffeln:https://019ded83-89be-75be-9ee9-7ebae13c5e5e.arena.site/

gemini-3-flash:https://019ded73-bd1b-78bc-9a1f-2f8374fa0fa9.arena.site/


kartoffeln:https://019ded5a-8a6b-7df2-ac70-71e2fdae5c06.arena.site/


kartoffeln:https://019ded72-f95a-7109-b420-1ca9335d8f60.arena.site/


Kimi-k2.6(好不容易刷出一个但写的有问题卡死在加载):https://019decf3-300a-7cb0-b80d-2ed827926a17.arena.site/

gemini-3-flash:https://019decf3-300a-7c24-ad70-46f85f82295f.arena.site/


kartoffeln:https://019decc6-835f-7edb-bd11-c448e4841b47.arena.site/

kartoffeln:https://019decb2-8a54-7703-80e2-f6ec5a9f9b52.arena.site/


gpt-5.4-high:https://019deca3-f219-73b5-8b08-700c10a817e3.arena.site/
kartoffeln:https://019deca1-3ad3-7f92-aba1-85751b583049.arena.site/


至于为什么给了这么多但是没glm5.1和Minimax m2.7这些国模生成的对比?可能是竞技场针对这些国模吧?没一次生成出来的,有点逆天了
如图:




9 个帖子 - 3 位参与者