gemini3.5flash这个安全对齐蛆完了
gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,
蒸馏 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 60 篇相关文章 · 第 1 / 3 页
gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,
是哪家来蒸馏 gpt的? 我猜是 minimax 17 个帖子 - 11 位参与者 阅读完整话题
如图,来源群友,非本人。仅讨论。。。 怎么爆赚,搞一个公益中转 <—> 买一点垃圾kiro渠道。岂不是起飞 5 个帖子 - 4 位参与者 阅读完整话题
依旧不说人话这一块,我看你也很迷,别是给豆包蒸馏了 3 个帖子 - 3 位参与者 阅读完整话题
经常刷到新闻和各种讨论说公司蒸馏员工,或者担心自己被蒸馏,那么我就很好奇,真的有人被公司蒸馏了,或者自己蒸馏自己有实际在使用并且有效果的吗? 非常好奇,因为只看到有人说被蒸馏但是没人说蒸馏的使用感受,所以真的有用吗? 16 个帖子 - 9 位参与者 阅读完整话题
与前排选手🛡️的思路不同,我一开始也丢给了大模型来出策略,但发现策略并不完备且及其消耗 token ,加上我本身的背景是算法,也划水过几次 luxai 的比赛,见识过模仿学习和强化学习在游戏 Agent 所发挥的作用,所以我的策略是让模型退居二线,目标是开发一套可迭代的机器学习模
这是把谷歌某位架构师蒸馏了吗 2 个帖子 - 2 位参与者 阅读完整话题
今天看到这个消息(如题),有点震惊,细想感觉有点可怕。 7 个帖子 - 5 位参与者 阅读完整话题
2026年2月,Anthropic发博客公布了一组检测数据 DeepSeek: 15万+次对话,用于模型蒸馏 ·Moonshot (Kimi) 340万+次对话: Q:· MiniMax1300万+次对话 总计1600万+次,通过24000个假账号完成 MiniMax的操作堪称工
最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。 FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。 核心目标:claude 的风格,降低 tool call 的失败率,让 a
最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。 FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。 核心目标:claude 的风格,降低 tool call 的失败率,让 a
最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。 FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。 核心目标:claude 的风格,降低 tool call 的失败率,让 a
企业对接蒸馏可以享受更低折扣 ai.centos.hk 1 个帖子 - 1 位参与者 阅读完整话题
现在gpt,gemini或者claude都会总结思维链,有没有什么prompt技巧或者别的方法让他后面直接生成完整思维链,试了些命令貌似效果不太好,模型的回复都很短 1 个帖子 - 1 位参与者 阅读完整话题
anthropic.com 2028: Two scenarios for global AI leadership Our views on the AI competition between the US and China. 30 个帖子 - 29 位参与者 阅读完整话题
从cot兴起,再到现在agent,现在日常工作无非是各种蒸馏、合成管道洗数据,业界或者未来还能有哪些方向最值得探索呢? 3 个帖子 - 3 位参与者 阅读完整话题
5 月 13 日,据路透社报道,Meta 员工周二在美国多个办公室分发传单,抗议公司近期在员工电脑上安装鼠标追踪软件的行为。 图注:Meta 这些传单出现在 Meta 办公室的会议室、自动售货机以及卫生纸架上方,鼓励员工签署一份反对此举的在线请愿书。这些传单和请愿书都引用了美国《
有人说蒸馏对claude模型没影响,顶多影响点算力资源,是这样吗?他们蒸馏出来的答案不会被低质量输出和原始输出风格相似,抓取不是更难分辨好坏嘛 9 个帖子 - 7 位参与者 阅读完整话题
本地部署的 ollama run qwen3.5 竟然是蒸馏的Gemini 18 个帖子 - 17 位参与者 阅读完整话题