可能是能反映AI在真实环境下情商的一道题?居然只有豆包完全答对了
提示词:解释这张图片的深意 需要模型理解的核心点是将高考说成平日限时训练的温柔感 线索:标准的高考时间,“完成限时小测不讲评,考完直接回家”的说法(显然指的是高考本身,而不是什么日常测验) 唯一且几乎完美的回答居然是Seed 2.0 Pro的: 其它模型几乎都牛头不对马嘴: 至少
答对 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 8 篇相关文章
提示词:解释这张图片的深意 需要模型理解的核心点是将高考说成平日限时训练的温柔感 线索:标准的高考时间,“完成限时小测不讲评,考完直接回家”的说法(显然指的是高考本身,而不是什么日常测验) 唯一且几乎完美的回答居然是Seed 2.0 Pro的: 其它模型几乎都牛头不对马嘴: 至少
查一个比较新的chrome api,只有豆包和grok能答对,其他诸如 gemini、gpt、千问、copilot、perplexity 等等要么说没有,要么就瞎编,其中deepseek更是把文档链接贴脸上都读不了 虽然豆包在编程上是一坨,但在web search和日常使用中真王
在x上看到了这个帖子 https://x.com/catsdotjpg/status/2051725047916634517 ,想着纯文本发给ai试试能不能知道这是什么 🌕🌕🌕🌕🌕🌕🌕🌕🌕🌕🌕🌕 🌕🌕🌕🌒🌕🌖🌒🌕🌕🌕🌕🌕 🌕🌕🌖🌑🌓🌑🌑🌕🌕🌕🌕🌕 🌕🌕🌗🌑🌑🌑🌑🌔🌕🌕🌕🌕 🌕🌕🌘
如题 有大佬可以答对么 我看看各位佬是谁的兵 哈哈哈哈哈 看抖音刷到的 笑死啦 11 个帖子 - 8 位参与者 阅读完整话题
有两个角度的图片 有一个答对概率高一点 这个答对概率比较高 这个答对概率很低 实测qwen的全家桶都全军覆没 谷歌的开源模型,3flash也无法解决 问题是:椅子是否朝向桌子 qwen和gemini的失败 gemini3.1pro也不行 chatgpt免费版也不行 出乎意料的是豆
你答对这道题的概率是多少? A: 0% B: 25% C: 50% D: 100% 2 个帖子 - 2 位参与者 阅读完整话题
常见测试题都能思考几秒光速答对并且考虑很全面 拍照发题目也是几秒就思考完了然后开始给答案并且还没啥问题 体感上输出速度和Gemini开快速都差不多了 这些问题换成5.4得推理半天还不一定对 8 个帖子 - 7 位参与者 阅读完整话题
女儿色盲问题还可以用来检测身边人是不是AI - 搞七捻三 - LINUX DO deepseek专业模式53s就做对了 https://chat.deepseek.com/share/aavs9oxif2l36ndt1y 接下来我们来看deepseek快速版的表现 (其实是我去试