对齐 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技

[分享发现] 从对齐到执行： grill-me + goal， AI 编码的完整工作流

先想清楚，再放手让 agent 跑上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样，把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题：对齐。但对齐只是第一步。你花了半小时

tech v2ex 2026-05-21 09:41:09+08:00

先想清楚，再放手让 agent 跑上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样，把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题：对齐。但对齐只是第一步。你花了半小时

tech v2ex 2026-05-21 08:54:34+08:00

为了防止有二次倒卖的坏人洗仓库，用AI偷改代码闭源投平台吃米。佬友们有什么妙招吗？目前知道的办法是想办法写石山把它的上下文窗口占满在代码里藏威胁性的英文注释块。在代码里塞一些无关紧要的虚假敏感身份信息？佬友们能出一些招式吗？ 2 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-09 03:03:15+08:00

anthropic.com Donating our open-source alignment tool Updating Petri to version 3.0 and donating it to Meridian Labs 我们还为 Petri 找到了新的归宿。我们已将

tech LinuxDo 最新话题 2026-05-08 15:15:01+08:00

万众期待的 Gemma 4 越狱破解版终于发布了！ Gemma-4-31B 现已彻底破解并完成对齐抹除版本名：Gemma-4-31B-JANG_4M-CRACK HarmBench 安全基准规避率 93.7%（149/159）原生基础模型，纯净无杂质适配苹果自研芯片，提

tech linux.do 2026-05-02 11:49:57+08:00

从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话继续讨论：省流: 内部训练gpt的时候，给他设定了人格，比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇随着不断迭代，就变成了如今这个样子我倒是没见过() 因为是英文用户专属() 文源APPso

tech linux.do 2026-04-30 19:48:37+08:00

以下为项目介绍正文内容，AI生成主要适合个人使用，为了个人使用 coding 出来的大家有需要的可以试试 https://github.com/WeiYYin/NeonNocturne 5 个帖子 - 3 位参与者阅读完整话题

tech linux.do 2026-04-30 15:54:38+08:00

UK Biobank - UK Biobank 和中国慢性病前瞻性研究China Kadoorie Biobank 5 个帖子 - 3 位参与者阅读完整话题

tech linux.do 2026-04-29 22:01:29+08:00

梦为什么会在这个时候出现梦到的"河对岸"“同行一段”“终点分离”，其实非常典型：河：象征已经隔开的世界同行：你心里仍然在延续的那条线分离：现实已经给出的答案再加上醒来刚好生病（发烧本身就容易触发情绪性梦境），这更像是一次"情绪收束&quo

tech linux.do 2026-04-29 11:32:54+08:00

DSv4降价消息一出来，瞬间瘫坐在椅子上，仿佛看到了原子弹爆炸一样咳咳，总之，本篇是笔记分享系列的第二期，本系列是用以促进自己精读论文的动力(读多论文就留下了扫读的坏习惯)，希望每次阅读时，能够细心一些分析有价值的论文，并将这些感悟记录下来，留给有需要的佬友。本论文分享系列会一

tech linux.do 2026-04-28 16:54:54+08:00

他是怎么一本正经的得出 9.9-9.11 结论的？？？以下是它的回复对齐小数位：9.9 = 9.90 列竖式：9.90 - 9.11 因为 9.90 < 9.11，结果为负，换成 -(9.11 - 9.90) 9.11 - 9.90 = 0.21 所以 9.90 - 9

tech linux.do 2026-04-17 22:01:35+08:00