:fire:【大模型系列34.2】逆水行舟,不进则退:对Google在IO 26大会表现的全面评价

这次发布会整体google表现很不好 3.5-flash,唯一确定的中型亮点 详情可参考我这篇: 🔥【大模型系列34】关于gemini-3.5-flash,pro和Google IO 26,你想知道的一切【更新Arena,AAnalysis评分】 下代次旗舰性能追平上代旗舰,意料之中,+0分 各榜单...
:fire:【大模型系列34.2】逆水行舟,不进则退:对Google在IO 26大会表现的全面评价
:fire:【大模型系列34.2】逆水行舟,不进则退:对Google在IO 26大会表现的全面评价

这次发布会整体google表现很不好

3.5-flash,唯一确定的中型亮点

详情可参考我这篇:🔥【大模型系列34】关于gemini-3.5-flash,pro和Google IO 26,你想知道的一切【更新Arena,AAnalysis评分】

下代次旗舰性能追平上代旗舰,意料之中,+0分

各榜单实际性能也没有超过3.1-pro
甚至在1m上下文只有20几%的性能,有点拉胯

速度快,当下+4分,长期+2分

速度也是智能的一部分,就像考试,别人做一道题的功夫,你可以做完一遍再检查两遍,最终分数就会更高

如果3.5-flash能长期维持300tps以上速度当然非常好,但监狱flash的历史,以及Antigravity砍额度的速度,我google能长期维持现在的速度,并不看好

flash每代都是刚出时很快,一般能有200-300tps,后面就降到100多泯然众人了,

新模型刚出时,当然算力充足,官方也会抽掉别处算力保障速度,但用的人一多,速度很快就下来了

比如io大会前一两天,Antigravity里的flash实际已经是3.5-flash了,很多人实测1000tps → iOS大会劈柴哥说300tps → 现在OpenRouter里实际只有150tps,aistudio等可能更快

当一个模型主要卖点只剩下“快”的时候,往往意味着性能一般+价格贵,除了“快“,实在没啥可吹的了

价格三倍,-3分

相当于用接近3.1pro的价格买了个接近上代3.1-pro的性能
那差不多价格我继续用3.1-pro不好么,性能比3.5-flash还强点


gemini-3.5-pro,没发布,等6月份,-3分

6月gpt5.6和opus4.8都出来了吧,gemini这一代等于别家两三代的间隔,很容易被别家技术甩开,也很容易被抢走关注度

考虑①flash现在价格已经占了pro生态位,②google现在各方面都在模仿A社和OpenAI,3.5-pro价格估计对标5.5和4.7,至少翻倍达到$4/$24水平


Gemini-omni-flash

详情可参考我这篇:🔥【图像视频系列8】关于Gemini-omni-flash,你想知道的一切

Flow里实际涨价好几倍,-3分

实际扣25积分,表面看跟veo3.1-fast差不多,但因为所有会员取消了ai积分,Flow积分要自己单买,

pro会员5h只能做3个omni-flash视频,而且功能比flow少得多,完全不能替代Flow

omni-flash性能与Seedance2没法比,-3分

仅比veo3.1略强,甚至不如sora2,憋了7个月,就别出来个这?
字节可以松一口气了
为什么omni卖点是"编辑",甚至都不敢挂veo系列大名,因为除了编辑,实在没啥可吹的了


Antigravity 2.0代替Antigravity IDE,难评,看未来发展

Antigravity是学cursor和windsurf,其实就是20亿美元买的Winsurf开发团队和技术授权,但是显然没跑通,cursor自己用户都大量流失到Claude Code和Codex
Antigravity 2.0的出现,其实就是自己承认Antigravity IDE的路线选错了,开始学codex app和claude app,又要出手机版

其实Antigravity IDE本来靠补贴opus砸了这么多钱,还是有不错的用户基数的,虽然猛砍opus额度,不上4.7,不上1m,没有effort,不停retry,一顿副操作猛如虎,早已经败光80%人缘,但不是还剩了20%么,

这么一折腾,剩那20%里面,估计里面很多人就喜欢VSCode功能的,又要流失一半

谷歌也知道会流失,我认为,其实谷歌从砍opus额度开始,内部基本就放弃Antigravity了,只留品牌,回炉重造,也不在乎流失

谷歌历史上80%的产品都进了著名的"谷歌坟场",谷歌砍项目,推倒重建,是从来不手软,财大气粗,人才充足,也折腾得起

因此Antigravity2.0根本不是什么升级,而是彻底推到重建
除了名字,与Antigravity IDE已经没啥关系了

Antigravity CLI,+2分

应该是阶梯gemini cli的,gemini cli六月即将下线
A社在25年第一个大力开发cli harness,当时我还看不懂,想怎么把cli这种DOS时代的老古董,靠无头服务器"苟活"至今的技术,挖坟又挖出来了

Antigravity CLI上线,主要是因为gemini cli在与Claude Code cli,codex cli的对阵中一败涂地,已经没有挽救价值了
当然这也不是cli的锅,主要是gmeini编程太弱,换什么harness都白搭,gemini cli又不像Antigravity可以靠opus拉用户

不过如果不解决底模编程能力的问题,换Antigravity CLI也是没用,神仙来也救不活


会员体系重塑,大砍Pro会员额度,-4分

详情可参考我这篇:🔥【大模型系列34.1】gemini-3.5起,谷歌狂砍Pro会员额度,田忌赛马耍猴惹众怒
Google明显学A社和OpenAI,搞5x,20x体系

问题是5x和20x是给编程配套的价格体系,你谷歌底模编程又不行,谁会去买你5x,20x当coding plan,你缺的真是5x这种会员规格吗?

以前L站很多人买ultra,是因为①opus额度高,②家庭组额度独立拼车分摊费用,③25000积分可以做1000个视频,④$250有半价优惠,现在这几项几乎都脚踝斩了,L站已经很少有人拼ultra车了吧

谷歌真正强的c端pro,额度却被从ultra1/5,削弱到1/20,招来主力用户pro的很大反弹,Gemini的Subreddit上今天一半都是在发牢骚骂娘的

就看3.5-pro编程能力把,如果像以前无数次一样,支棱不起来,5x/20x也没啥用


没有新nano-banana-pro-2,-2分

nano-banana-pro已经上线6个月了,而且现任已经被gpt-image-2全面反超了,这么久拿不出竞品,尽显颓势
nano-banana-2不算,只是flash性质的小参数模型,性能还不如nano-banana-pro

5 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文