gpt还是吊打其他模型

有时候逛论坛看到各种模型发布了,就看各种测评网站,久而久之其实也不太信这些网站,因为很难说清楚这些网站有没有收钱,或者是模型有没有过拟合数据集。 今天刚好送老婆坐飞机出国,但是刚刚看飞机的位置发现在缅甸和云南的交界,和航旅纵横、飞常准的路线图不一样(预计的路线是走中国西北),心中有些害怕就查了一下历...
gpt还是吊打其他模型
gpt还是吊打其他模型

有时候逛论坛看到各种模型发布了,就看各种测评网站,久而久之其实也不太信这些网站,因为很难说清楚这些网站有没有收钱,或者是模型有没有过拟合数据集。

今天刚好送老婆坐飞机出国,但是刚刚看飞机的位置发现在缅甸和云南的交界,和航旅纵横、飞常准的路线图不一样(预计的路线是走中国西北),心中有些害怕就查了一下历史路线图。发现有两条路线,可能会根据各种原因进行切换。

我就拿这个问题问了一下gpt、grok、gemini。

问题

aaa - bbb(机场代码),某某航空的飞机,我看飞行历史记录大概有两条飞行线路,请你看一下这两条线路是什么,具体经过哪里,那个国家?然后告诉我26年4月25号从aaa起飞的航班走的是哪条?

结果

我分别问了两次,只有gpt 5.5 thinking的其中一次回答,能够正确推断出路线并推断出当前航线走的是哪条。

只能说gpt真牛逼,而且我有点对grok无语了,一直以来我觉得 Gork 的搜索非常好用,但是最近我发现我把文档网址给他,他也会胡编乱造一些信息给我,我在自定义里面明确要求了必须验证信息真实性,真是没招了

38 个帖子 - 9 位参与者

阅读完整话题

来源: linux.do查看原文