deepseek v4的多模态怎么样?不会是胶水吧?
v4p会有多模态吗?感觉智力上v4比较一般,但是注意力很不错。不过这个多模态是什么情况? 2 个帖子 - 2 位参与者 阅读完整话题
注意力 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 10 篇相关文章
v4p会有多模态吗?感觉智力上v4比较一般,但是注意力很不错。不过这个多模态是什么情况? 2 个帖子 - 2 位参与者 阅读完整话题
一个重构项目,多终端一直卡着无法debug完成,表现为ABCDE五个终端,所有输入都只会错误的输入到A终端,且经过多轮debug无法解决。 当从300K上下文Debug到400K上下文时,v4 pro max开始每轮对话添加一个小修复和日志埋点让我测试运行。然后 加埋点→收集日志
发帖原因是最近接触LOL发现 我似乎容易分不清敌友 ,比如lol我玩寒冰射手我会不自觉走进对方兵线,尤其开团和兵线多的时候,我会找不到自己,经常不知道怎么回事我就和人家’ 近战 ’了。nba2k也是,我防守的时候总是不记得自己的角色,导致在比赛的时我以为我一直是在对位对面,经常神
测了几个会话下来,发现ds v4 pro max的缓存率不断上升,从85%升到95%左右并稳定下来。 官Key显示 145.23人民币。 目前单轮对话最长已经到了500k,注意力正常,没有偏离主线。 12 个帖子 - 8 位参与者 阅读完整话题
v4一出,马上就来试试,但是感觉pro虽然智商和知识量很不错,但是注意力貌似有问题,关注的点容易飘,在我目前考公复习的场景并没有和v4 flash拉开特别大的差距,但是falsh就让人比较舒服,就是刚刚好那种感觉,只是知识量不够。 当然只是我个人场景的感受,仅仅只是考公问答复习这
感觉deepseek的注意力已经是国产的第一了,智力上大家感觉怎么样? 2 个帖子 - 2 位参与者 阅读完整话题
其他的在当今的国模环境来说 都没啥突出的 而且没有多模态更是硬伤 也只有强大的注意力能说道做道了 2 个帖子 - 2 位参与者 阅读完整话题
DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求 1 个帖子 - 1 位参与者 阅读完整话
正值大二的我,说一下最近都在l站干嘛 关注Claude code 如何解除any局限 any该怎么用 只是一个搬运工 看别人这样做的 我直接cv过来 会改的就改一下 不会改的直接问ai 其中原理为什么一概不知 也懒得去知道 因为本身自己也不懂互联网知识 自己是学嵌入式的 平时也有
介于opus4.7的注意力和gemini差不多只有100k左右的有效注意力,有点想换回opus4.6 1m在Claude code中使用。 就是不知道现在的opus4.6智商是否恢复了,有没有测试过的佬呢? 1. 9.9-9.11=? opus 4.6答错 opus4.7正确 2