对新出的几个模型需求完善程度比拼 - 网络篇

无聊的时候对一些新出的模型提了一个很久之前困扰我网络折腾上的难题。 题目如下: 我有一个需求,就是通过有公网IPv4的服务器+wireguard VPN将NAT里面服务器的端口暴露出去,并且能够让NAT服务器的服务能看得到请求客户端原始的IP,并且没有Proxy Protocol 第二题: 但是我希...
对新出的几个模型需求完善程度比拼 - 网络篇
对新出的几个模型需求完善程度比拼 - 网络篇

无聊的时候对一些新出模型提了一个很久之前困扰我网络折腾上的难题。

题目如下:

我有一个需求,就是通过有公网IPv4的服务器+wireguard VPN将NAT里面服务器的端口暴露出去,并且能够让NAT服务器的服务能看得到请求客户端原始的IP,并且没有Proxy Protocol

第二题:

但是我希望NAT服务器对外面的请求(比如说Google或者Docker)还是走原来的Gateway,而不是被公网服务器全局代理,怎么改?

参与的模型如下:

Claude Opus 4.7 (Adaptive Thinking) (网页聊天 - 无痕)

Claude Sonnet 4.6 (Adaptive Thinking) (网页聊天 - 无痕)

GPT 5.5 (Cherry Studio 自动 Thinking) (官方API)

DeepSeek v4 Flash (Cherry Studio 自动 Thinking) (官方API)

GLM 5.1 (Cherry Studio 自动 Thinking) (官方API)

Deepseek V4 Pro (Cherry Studio 自动 Thinking) (官方API)

*为了避免Memory的影响就给Claude开了无痕模式

先说结果:两个Claude模型给出的回答质量最优;GPT 5.5给的方案第一题正确,第二题方案可用,但兼容性有问题;DeepSeek v4 Flash答对了第一题,但败在了第二题;剩下的两个模型第一题都做出问题了,并且错的方向相同。

Claude 给我的答案最满意,两个模型都在我问出第二个问题之前就已经给出了解决方案。Sonnet是在回答最后提了问2的解决方案,Opus是将问2的解决方案作为"必需操作"和问1的答案写在一起的。并且都是使用fwmark来分开VPN出站和默认网关出站数据包的,这点令我很意外和满意,因为对UDP更友好,并且Opus还强调了方案对UDP连接可能存在的问题。

GPT 5.5 给的方案中规中矩,第二题答案在我提出之后才补上来,使用的是根据源IP查找路由表的方案。能行,是我之前自己想到的方案,但是对UDP很不友好。

Deepseek Flash模型反而答对了一题是我没想到的

Deepseek v4 Pro和GLM 5.1犯了类似的错误,将AllowedIPs填写成了Wireguard服务器的内网IP或者WG的内网网段,看起来是对Wireguard不熟悉导致的。

各个模型回答如下:

Opus 4.7: (区块截图 - 多图警告)

image

image

image

(Sonnet因为使用的是隐私模式忘记复制保存了…)

GPT 5.5:

第一题:

image

第二题:

image

GLM 5.1:

image

image

Deepseek V4 Pro:

image

5 个帖子 - 2 位参与者

阅读完整话题

来源: linux.do查看原文