模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第17页 - 钛刻科技 | TCTI.cn

模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第17页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 2501 篇相关文章 · 第 17 / 126 页

当马一龙又砍Grok free的模型使用,搜索最佳模型已经是GPT5.5了

之前的Grok 4.1 fast刷新了我对马一龙家模型的认知,除了nsfw原来他家模型也能参与生活中的AI使用啊,当时我画了个帕累托前沿曲线, Grok 4.1 fast在达到GPT搜索95%以上的水平下基本是松手就出结果的,完全是高阶版的谷歌搜索/百度搜索 。 来到Grok 4

tech linux.do 2026-05-01 05:35:42+08:00

在 Claude Code 中使用 NVIDIA Nim (Minimax-m2.7) API 出错:未找到模型错误

在 NVIDIA API 页面上,我免费获得了 Minimax API。我想知道是否可以在 Claude Code 中使用它。 我尝试过了,但是出现了这个错误: There's an issue with the selected model (minimaxai/mi

tech linux.do 2026-05-01 04:25:53+08:00

私有化部署大模型的“终点”是 Mac 还是 Nvidia?

自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark

tech www.v2ex.com 2026-05-01 01:27:08+08:00

私有化部署大模型的“终点”是 Mac 还是 Nvidia?

自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark

tech www.v2ex.com 2026-05-01 00:27:08+08:00

Openrouter上新新匿名模型openrouter/owl-alpha(longcatV2),1m上下文,看介绍为龙虾而生

openrouter/owl-alpha 应该是longcat V2 17tps,就这速度还cc和龙虾啊 (为啥秘密代码是:ZOO-OWL-2024,难不成幻觉了,还是美团偷偷杀疯了) 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-30 23:41:22+08:00

mercury-2模型给感兴趣的佬友们试试,大概还有一亿多的token

https://xiaolapi.cn/v1 c2stNEZEREZmcWprcFp0RzNUZDk4Y1ZJVlQ5U3R0TlNDZjM5TkNLNzdWanN3NjhtQmhL 佬友们自己用base64解密 9 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-04-30 23:05:57+08:00

OpenAI回应其模型的“哥布林”怪癖 Codex曾被要求不得再提神话生物

在《Wired》披露OpenAI曾向其编程模型下达“永远不要谈论哥布林、gremlins、浣熊、巨魔、食人魔、鸽子或其他动物或生物”的内部指令后,OpenAI已在官网发文解释这一现象,称这是一种模型在训练过程中形成的“奇怪习惯”。 OpenAI表示,这类涉及哥布林及其他生物的隐喻

tech plink.anyfeeder.com 2026-04-30 23:05:48+08:00

新匿名模型Owl Alpha出现在openrouter

openrouter.ai Owl Alpha - API Pricing & Providers Owl Alpha is a high-performance foundation model designed for agentic workloads. $0 pe

tech linux.do 2026-04-30 22:43:05+08:00

DeepSeek 公布多模态模型技术报告

IT之家 4 月 30 日消息,DeepSeek 在 GitHub 平台正式发布了其多模态大模型,并同步公开了配套技术报告。该报告提出了一种基于“视觉原语”的创新推理框架,旨在突破当前多模态大语言模型(MLLMs)在空间参照任务中的核心瓶颈。 技术报告指出,尽管多模态大语言模型近

tech www.ithome.com 2026-04-30 22:39:33+08:00

哪个端侧小参数模型最好用

最近想要找一个端侧的小模型,最高8b,不知道哪个好,特地来问问佬友 小模型的话我就不看编码能力了,主要看看角色扮演、简单任务执行(指令遵循)、在一般硬件上的推理速度等 目前的想法是gemma4-e2b,但是在角色扮演上我感觉不太行 5 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-04-30 21:59:52+08:00

GPT-image-2似乎拥有分步生成合并能力

从 APP 调用的思维链可见,指导 image 模型的语言模型会分步骤指导生图再合并之,很有趣 2 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-30 21:59:41+08:00

DeepSeek的新视觉模型基于新的视觉框架,基底模型是v4 flash

DeepSeek联合北京大学、清华大学发布论文《Thinking with Visual Primitives》,提出一种新的多模态推理框架。 该框架的核心做法是将空间标记——坐标点和边界框——提升为模型思维链中的“最小思考单元”,在推理过程中直接交织使用,使模型在"思

tech linux.do 2026-04-30 20:54:57+08:00

求助大佬,有没有可以2api生视频的方案

最近部署了站内大佬的waoowaoo项目,但是没有生视频的api,请教大佬有可以2api视频模型的这个方案吗 3 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-30 20:15:16+08:00

OpenAI将推出网络安全专用模型GPT-5.5-Cyber 首批仅向"关键防御者"开放

OpenAI正准备推出一款新的前沿网络安全模型GPT-5.5-Cyber。公司首席执行官萨姆·奥尔特曼表示,这一模型不会面向公众开放,而是会率先提供给一批经过筛选、值得信任的“网络防御者”,以帮助相关机构加强自身的网络安全防护能力。 根据奥尔特曼在X平台上的说法,这一有限范围的首

tech plink.anyfeeder.com 2026-04-30 20:05:19+08:00

「转载」谁在 GPT-5.5 脑子里塞了一群「妖怪」?|从gpt的哥布林事件看对齐危机

从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话 继续讨论: 省流: 内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇 随着不断迭代,就变成了如今这个样子 我倒是没见过() 因为是英文用户专属() 文源APPso

tech linux.do 2026-04-30 19:48:37+08:00

OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber,暂不向公众开放

IT之家 4 月 30 日消息,OpenAI 正准备推出一款全新的前沿网络安全模型 ——GPT-5.5-Cyber。公司首席执行官山姆・奥尔特曼表示,该模型不会向普通公众开放,将率先定向开放给一批经过筛选、可信赖的“网络安全防护人员”,助力各类机构强化自身网络防御能力。 奥尔特曼

tech www.ithome.com 2026-04-30 19:19:47+08:00

[人工智能] Krill-ai 国产模型 阿里云 4.5 折 token plan 开售

https://www.krill-ai.com/cn-models Krill-ai 国内模型 token plan 模型包括 qwen3.6-plus 、glm-5.1 、MiniMax-M2.7 、 deepseek-v4(pro/flash)、Kimi-2.6 后续所有阿

tech v2ex.com 2026-04-30 19:12:10+08:00

[人工智能] Krill-ai 国产模型 阿里云 4.5 折 token plan 开售

https://www.krill-ai.com/cn-models Krill-ai 国内模型 token plan 模型包括 qwen3.6-plus 、glm-5.1 、MiniMax-M2.7 、 deepseek-v4(pro/flash)、Kimi-2.6 后续所有阿

tech v2ex.com 2026-04-30 19:12:10+08:00

排好队,一个一个毙,天才智谱

这就是国内第一AI哦 坐等DeepSeek出个coding模型,杀杀智谱的锐气 6 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-30 18:52:22+08:00

DeepSeek发布「视觉原语思考」框架,让多模态模型边推理边“指”

DeepSeek联合北京大学、清华大学发布论文《Thinking with Visual Primitives》及其开源仓库,提出一种新的多模态推理框架。该框架的核心做法是将空间标记——坐标点和边界框——提升为模型思维链中的“ 最小思考单元 ”,在推理过程中直接交织使用,使模型在

tech linux.do 2026-04-30 18:35:38+08:00