模态 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第4页 - 钛刻科技 | TCTI.cn

模态 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第4页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 71 篇相关文章 · 第 4 / 4 页

Qwen 3.6 Max Preview 上线百炼平台,上下文 256K 不支持多模态输入

之前 Qwen 3.6 Plus 测试的时候,好像一开始也是不支持多模态输入,应该不至于是模型本身不支持吧。 3 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-20 21:42:24+08:00

阿里开源 Qwen3.6-35B-A3B 模型:主打高效轻量,支持多模态思考

IT之家 4 月 20 日消息,4 月 19 日(昨天)晚间,千问 3.6 系列中等尺寸模型 Qwen3.6-35B-A3B 模型正式开源,仅激活 3B。 根据介绍,该模型不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型 Qwen3.5-35B-A3B,并可与 Qwe

tech www.ithome.com 2026-04-20 14:46:49+08:00

AI混剪视频各位大佬有没有搞过

AI混剪视频各位大佬有没有搞过 我的想法,多模态模型跑本地 我有一个Mac mini可以跑模型,但是我没有找到相对应的多模态模型 使用skill来剪辑输出。 然后一大堆视频,拍的vlog,对给AI混剪,随便这么剪辑 有没有搞头 5 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-19 18:46:46+08:00

智谱coding plan怎么还没上glm 5v turbo

有点想用他那个多模态了,现在上传图片还得保存到本地让模型自己读,麻烦得很,都10多天了,还没上,而且看价格表,5.1的参数量应该更大,上5v-turbo应该也能缓解一点算力紧张吧 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-18 22:29:26+08:00

分享 MiniMax Token Plan,支持全模态调用

23号到期 sk-cp-ecX_dNHFQlzyf3W6jljM3tQXrg4kPEVQSLNxECs7g3ShRQAcdqGx9EYrcWZwMEpFrvCwK-SWfBh5ETIuoFyIDWH0JA7IXVN4D_00O5xLcu2N5W7utx0iNko 支持生成音乐 各

tech linux.do 2026-04-18 18:53:17+08:00

元戎启行首次证实前 DeepSeek 多模态核心研究员阮翀加盟,出任首席科学家

IT之家 4 月 12 日消息,由车百会研究院主办的智能电动汽车发展高层论坛(2026)在北京召开,主题为“推进新能源汽车智能化、绿色化、融合化、国际化发展”。 元戎启行 CEO 周光上发表演讲,宣布元戎已打造 400 亿参数规模的基础模型,实现辅助驾驶从“执行系统”到“认知系统

tech www.ithome.com 2026-04-12 18:17:11+08:00

元戎启行全面押注大模型自动驾驶

4月25日,北京车展上,前DeepSeek多模态技术核心研究员阮翀以元戎启行首席科学家身份首次公开亮相。元戎启行CEO周光表示,多模态大模型能力在2026年初取得突破性进展,大模型自动驾驶路线起点已远优于上一代技术,小模型自动驾驶存在“跷跷板效应”,无法实现全场景安全覆盖,公司已

tech 36kr.com

海光DCU Day 0适配商汤科技SenseNova-U1

36氪获悉,4月27日,商汤科技推出并开源新一代原生多模态大模型SenseNova-U1,海光DCU率先完成全量适配,是国内首批适配SenseNova-U1的国产芯片厂商。SenseNova-U1基于商汤行业首创的NEO-unify原生架构,无需编解码器即可实现多模态理解与生成的

tech 36kr.com

腾讯混元3D世界模型2.0发布并开源

36氪获悉,4月16日,混元3D世界模型 2.0(HY-World 2.0)正式发布并开源。HY-World 2.0是一个多模态世界模型,能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟3D世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,支持与现有的游

tech 36kr.com

阿里HappyHorse开启灰测

36氪获悉,4月27日,阿里巴巴视频生成模型HappyHorse1.0开启灰测。HappyHorse 1.0依托原生多模态架构,采用音视频联合生成方案,面向广告、电商、短剧、社媒创意等内容生产场景,提供从智能生成到编辑的一体化创作能力。官网720P和1080P的视频生成刊例价分别

tech 36kr.com

英伟达推出Nemotron 3 Nano Omni模型

当地时间4月28日,英伟达在公司博客宣布,推出名为Nemotron 3 Nano Omni的开源全模态推理模型,旨在为企业级AI Agent提供一体化基础模型底座。英伟达介绍,这款模型融合了视觉、音频与语言能力,将帮助AI智能体实现高达9倍的效率提升。(界面)

tech 36kr.com