多模态DSv4要来了
快科技4月28日消息,DeepSeek V4刚发布还不到5天,光是降价就来了三轮,然而他们的后续动作还很多,马上就要推出满血DeepSeek V4,补上多模态支持。 **DeepSeek负责多模态开发的研究员陈小康(xiaokang_chen)今天下午在X上预告新版DeepSee
模态 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 71 篇相关文章 · 第 3 / 4 页
快科技4月28日消息,DeepSeek V4刚发布还不到5天,光是降价就来了三轮,然而他们的后续动作还很多,马上就要推出满血DeepSeek V4,补上多模态支持。 **DeepSeek负责多模态开发的研究员陈小康(xiaokang_chen)今天下午在X上预告新版DeepSee
应该是一个人 5 个帖子 - 5 位参与者 阅读完整话题
deepseek多模态研究员,北京大学博士 陈小康 在X上透露 33 个帖子 - 33 位参与者 阅读完整话题
最新的DeepSeek又便宜又好(主要是便宜),想把大部分工作转移到DeepSeek上了 但偶尔还会有传图片的需求,这时候手动切换一下模型怪麻烦的,有没有办法给ai做一个前置判断,识别到有图片,就调用一下多模态的模型,然后输出文字化的图片内容给DeepSeek的 无感的 方案呢
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
qwenclaw添加sub2api可以连接但是识别多模态就不行(gpt5.4),没办法吧sub放进去cpa套了一层,之前一直没用cpa就是感觉管理账号不方便,但是cpa的兼容性是真好啊 1 个帖子 - 1 位参与者 阅读完整话题
我甚至懒得上官网求证… 暂时当水一个,如果是的话,多模态能力如何呢? 至少来说 图片提取文字的能力如何? 10 个帖子 - 10 位参与者 阅读完整话题
江山代有大模出,各领风骚数十天。如 这个帖子 所述,大模型的SOTA变动之快,让人目不暇接。虽说每次更新都有指标上的进步,但是在发布前挪用算力、降智以凸显对比已经成了常规操作。更不用说Gemini 3 Pro/Opus4.7 这种某些方面开倒车的更新了。 于是我挺好奇,现在的最佳
佬友们,目前研0空窗期,想搞多模态大模型方向,有什么推荐教程或者路线帖子推荐吗,目前在艰难学习CS336中 8 个帖子 - 6 位参与者 阅读完整话题
在官网对话,还是V3,没有多模态的能力 4 个帖子 - 4 位参与者 阅读完整话题
官方说这是预览版,那正式版是不是就更强了呀,不是完全体评分都在开源第一梯队了,如果是正式版,会不会有多模态能力捏~~以前看到有佬许愿要大上下文窗口,应验了,我们是不是可以期待一手多模态了,然后等 昇腾950 部署好了,再把多模态上了,来个正式版V4,perfect! 3 个帖子
一直期待deepseek出个带视觉的,还是期望过高了 3 个帖子 - 3 位参与者 阅读完整话题
DeepSeek_V4.pdf 1 个帖子 - 1 位参与者 阅读完整话题
DeepSeek V4 好像官方那边给出的信息中还是没有提到多模态,也没有coding plan,佬们怎么看ds在如今大模型中所处的生态位 想听听佬们的理解 9 个帖子 - 9 位参与者 阅读完整话题
看了下官方的公众号介绍,没有提到多模态的内容。 似乎这次的两个v4模型还是都不支持多模态? 1 个帖子 - 1 位参与者 阅读完整话题
Cherry Studio v1.9.2的Cherry Claw调用豆包多模态模型dola-seed-2.0-pro识别工作目录下的一个图片,为什么识图还要调用如下MCP?而且MCP转圈运行几分钟也不成功或报错。 browser:screenshot MCP 服务器工具 输入 t
是codex cli,还是app,还是装在wsl上,另外装在wsl上会和宿主机器冲突吗 17 个帖子 - 10 位参与者 阅读完整话题
从这里继续 真是服了,这就是qwen的多模态功能吗 3 个帖子 - 2 位参与者 阅读完整话题
app.mokahr.com DeepSeek招聘 2026年幻方量化社会招聘正在进行,点击申请职位 为不存在的东西安全吗 3 个帖子 - 3 位参与者 阅读完整话题
我测试了 GPT5.4pro、CLAUDE-OUPS-4-7、GLM-5V-TURBO、豆包2.0、qwen3.6、qwen3-VL-PLUS、 Qwen-omni 、Gemini-3.1-pro 最强还是GLM-5V-TURBO。 20分钟的课程视频,逐帧分析、ppt位置、pp