蒸馏 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

蒸馏 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 60 篇相关文章 · 第 1 / 3 页

gemini3.5flash这个安全对齐蛆完了

gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,

tech LinuxDo 最新话题 2026-05-24 10:04:19+08:00

竞猜,那个神秘的男人是哪家的?

是哪家来蒸馏 gpt的? 我猜是 minimax 17 个帖子 - 11 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-24 01:50:03+08:00

你好老板,我这边收上下文缓存数据正常脱敏 模型蒸馏用的去重后1m 10元 (水)(来源群友)

如图,来源群友,非本人。仅讨论。。。 怎么爆赚,搞一个公益中转 <—> 买一点垃圾kiro渠道。岂不是起飞 5 个帖子 - 4 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-22 16:54:19+08:00

哈哈哈哈我不行了,中文互联网的口头禅都被5.5学去了

依旧不说人话这一块,我看你也很迷,别是给豆包蒸馏了 3 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-21 16:22:25+08:00

天天说被蒸馏了,真的有人被蒸馏了以后能用的吗?

经常刷到新闻和各种讨论说公司蒸馏员工,或者担心自己被蒸馏,那么我就很好奇,真的有人被公司蒸馏了,或者自己蒸馏自己有实际在使用并且有效果的吗? 非常好奇,因为只看到有人说被蒸馏但是没人说蒸馏的使用感受,所以真的有用吗? 16 个帖子 - 9 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-21 08:15:57+08:00

[游戏] Agentank 李尔,一个 18k 参数的蒸馏模型如何逼近头部选手,挤进王者局

与前排选手🛡️的思路不同,我一开始也丢给了大模型来出策略,但发现策略并不完备且及其消耗 token ,加上我本身的背景是算法,也划水过几次 luxai 的比赛,见识过模仿学习和强化学习在游戏 Agent 所发挥的作用,所以我的策略是让模型退居二线,目标是开发一套可迭代的机器学习模

tech v2ex 2026-05-19 23:41:40+08:00

反重力Flash开始内置一些提示词了

这是把谷歌某位架构师蒸馏了吗 2 个帖子 - 2 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 10:03:54+08:00

购买百万二手实体书训练AI模型,扫描蒸馏后销毁!

今天看到这个消息(如题),有点震惊,细想感觉有点可怕。 7 个帖子 - 5 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-18 11:16:40+08:00

2026年2月,Anthropic发博客公布了一组检测数据

2026年2月,Anthropic发博客公布了一组检测数据 DeepSeek: 15万+次对话,用于模型蒸馏 ·Moonshot (Kimi) 340万+次对话: Q:· MiniMax1300万+次对话 总计1600万+次,通过24000个假账号完成 MiniMax的操作堪称工

tech LinuxDo 最新话题 2026-05-16 23:09:38+08:00

[分享创造] Qwen3.5-Sonnet-9B: 专为 Coding Agent 蒸馏的 9B 小模型

最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。 FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。 核心目标:claude 的风格,降低 tool call 的失败率,让 a

tech v2ex 2026-05-16 17:12:47+08:00

[分享创造] Qwen3.5-Sonnet-9B: 专为 Coding Agent 蒸馏的 9B 小模型

最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。 FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。 核心目标:claude 的风格,降低 tool call 的失败率,让 a

tech v2ex 2026-05-16 15:45:13+08:00

[分享创造] Qwen3.5-Sonnet-9B: 专为 Coding Agent 蒸馏的 9B 小模型

最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。 FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。 核心目标:claude 的风格,降低 tool call 的失败率,让 a

tech v2ex 2026-05-16 15:25:54+08:00

星辰AI aws bedrock降价至2.5

企业对接蒸馏可以享受更低折扣 ai.centos.hk 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-15 21:09:37+08:00

求助!有什么prompt技巧可以获取gpt或者claude的完整思维链进行蒸馏呢

现在gpt,gemini或者claude都会总结思维链,有没有什么prompt技巧或者别的方法让他后面直接生成完整思维链,试了些命令貌似效果不太好,模型的回复都很短 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-15 15:20:12+08:00

Anthropic: 如果美国维持芯片禁运、防范模型蒸馏,到2028年可以让中国模型落后12-24个月。

anthropic.com 2028: Two scenarios for global AI leadership Our views on the AI competition between the US and China. 30 个帖子 - 29 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-15 11:56:02+08:00

大模型领域后训练未来还能有那些方向

从cot兴起,再到现在agent,现在日常工作无非是各种蒸馏、合成管道洗数据,业界或者未来还能有哪些方向最值得探索呢? 3 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-14 15:08:53+08:00

有跑 claude 模型蒸馏的大佬吗?

tech V2EX - 技术 2026-05-14 14:56:03+08:00

蒸馏员工技能?Meta 美国员工抗议公司采集键盘鼠标操作数据

5 月 13 日,据路透社报道,Meta 员工周二在美国多个办公室分发传单,抗议公司近期在员工电脑上安装鼠标追踪软件的行为。 图注:Meta 这些传单出现在 Meta 办公室的会议室、自动售货机以及卫生纸架上方,鼓励员工签署一份反对此举的在线请愿书。这些传单和请愿书都引用了美国《

tech IT之家 2026-05-13 11:20:12+08:00

我想问下 各位大佬 小米 华为 字节 这些公司蒸馏 claude opus模型的回答,会污染下个版本opus的性能嘛

有人说蒸馏对claude模型没影响,顶多影响点算力资源,是这样吗?他们蒸馏出来的答案不会被低质量输出和原始输出风格相似,抓取不是更难分辨好坏嘛 9 个帖子 - 7 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-12 19:40:48+08:00

国内AI大模型全是蒸馏的吗?

本地部署的 ollama run qwen3.5 竟然是蒸馏的Gemini 18 个帖子 - 17 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-11 21:46:21+08:00