模态 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn

模态 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 71 篇相关文章 · 第 3 / 4 页

多模态DSv4要来了

快科技4月28日消息,DeepSeek V4刚发布还不到5天,光是降价就来了三轮,然而他们的后续动作还很多,马上就要推出满血DeepSeek V4,补上多模态支持。 **DeepSeek负责多模态开发的研究员陈小康(xiaokang_chen)今天下午在X上预告新版DeepSee

tech linux.do 2026-04-29 07:55:13+08:00

deepseek的多模态似乎要来了(原推文已被删除)

应该是一个人 5 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-04-28 19:08:49+08:00

DeepSeek即将推出新的多模态模型

deepseek多模态研究员,北京大学博士 陈小康 在X上透露 33 个帖子 - 33 位参与者 阅读完整话题

tech linux.do 2026-04-28 19:04:26+08:00

请问有没有用前置ocr模型,给非多模态模型提供视觉能力的方案呢

最新的DeepSeek又便宜又好(主要是便宜),想把大部分工作转移到DeepSeek上了 但偶尔还会有传图片的需求,这时候手动切换一下模型怪麻烦的,有没有办法给ai做一个前置判断,识别到有图片,就调用一下多模态的模型,然后输出文字化的图片内容给DeepSeek的 无感的 方案呢

tech linux.do 2026-04-28 13:15:02+08:00

【开源自荐】AMC WebUI:面向 Gemini 的多模态 WebUI

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺

tech linux.do 2026-04-27 23:30:55+08:00

qwenclaw识别sub2api渠道不友好

qwenclaw添加sub2api可以连接但是识别多模态就不行(gpt5.4),没办法吧sub放进去cpa套了一层,之前一直没用cpa就是感觉管理账号不方便,但是cpa的兼容性是真好啊 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-27 16:12:53+08:00

话说都V4了,DeepSeek现在还不是多模态吗

我甚至懒得上官网求证… 暂时当水一个,如果是的话,多模态能力如何呢? 至少来说 图片提取文字的能力如何? 10 个帖子 - 10 位参与者 阅读完整话题

tech linux.do 2026-04-27 00:25:33+08:00

除去Agentic和多模态能力,这一年基模底层真的进步了多少?

江山代有大模出,各领风骚数十天。如 这个帖子 所述,大模型的SOTA变动之快,让人目不暇接。虽说每次更新都有指标上的进步,但是在发布前挪用算力、降智以凸显对比已经成了常规操作。更不用说Gemini 3 Pro/Opus4.7 这种某些方面开倒车的更新了。 于是我挺好奇,现在的最佳

tech linux.do 2026-04-26 18:36:41+08:00

多模态大模型学习路线求助

佬友们,目前研0空窗期,想搞多模态大模型方向,有什么推荐教程或者路线帖子推荐吗,目前在艰难学习CS336中 8 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-04-26 11:20:13+08:00

chat.deepseek.com 还没有上线V4版本吗?

在官网对话,还是V3,没有多模态的能力 4 个帖子 - 4 位参与者 阅读完整话题

tech linux.do 2026-04-24 23:02:21+08:00

没人关注deepseekV4只是预览版吗?

官方说这是预览版,那正式版是不是就更强了呀,不是完全体评分都在开源第一梯队了,如果是正式版,会不会有多模态能力捏~~以前看到有佬许愿要大上下文窗口,应验了,我们是不是可以期待一手多模态了,然后等 昇腾950 部署好了,再把多模态上了,来个正式版V4,perfect! 3 个帖子

tech linux.do 2026-04-24 18:40:24+08:00

deepseek v4 依旧不支持多模态吗

一直期待deepseek出个带视觉的,还是期望过高了 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-24 11:56:26+08:00

DeepSeek_V4 论文概览,主打高效,无多模态

DeepSeek_V4.pdf 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 11:47:58+08:00

DeepSeek V4 好像官方那边给出的信息中还是没有提到多模态,也没有coding plan,佬们怎么看ds在如今大模型中所处的生态位

DeepSeek V4 好像官方那边给出的信息中还是没有提到多模态,也没有coding plan,佬们怎么看ds在如今大模型中所处的生态位 想听听佬们的理解 9 个帖子 - 9 位参与者 阅读完整话题

tech linux.do 2026-04-24 11:30:19+08:00

DeepSeek V4似乎还是没有多模态?

看了下官方的公众号介绍,没有提到多模态的内容。 似乎这次的两个v4模型还是都不支持多模态? 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 11:16:01+08:00

Cherry Studio的Cherry Claw调用多模态dola-seed-2.0-pro为什么识图还要调用MCP?

Cherry Studio v1.9.2的Cherry Claw调用豆包多模态模型dola-seed-2.0-pro识别工作目录下的一个图片,为什么识图还要调用如下MCP?而且MCP转圈运行几分钟也不成功或报错。 browser:screenshot MCP 服务器工具 输入 t

tech linux.do 2026-04-23 19:26:48+08:00

windows下 codex推荐安装那种模态?

是codex cli,还是app,还是装在wsl上,另外装在wsl上会和宿主机器冲突吗 17 个帖子 - 10 位参与者 阅读完整话题

tech linux.do 2026-04-23 17:48:54+08:00

阿里云 qwen真是个草台班子

从这里继续 真是服了,这就是qwen的多模态功能吗 3 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-23 17:36:58+08:00

Deepseek招聘多模态安全-模型策略产品经理

app.mokahr.com DeepSeek招聘 2026年幻方量化社会招聘正在进行,点击申请职位 为不存在的东西安全吗 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-23 12:36:03+08:00

亲测多模态大模型GLM-5V-TURBO,遥遥领先

我测试了 GPT5.4pro、CLAUDE-OUPS-4-7、GLM-5V-TURBO、豆包2.0、qwen3.6、qwen3-VL-PLUS、 Qwen-omni 、Gemini-3.1-pro 最强还是GLM-5V-TURBO。 20分钟的课程视频,逐帧分析、ppt位置、pp

tech linux.do 2026-04-20 23:08:13+08:00