[分享发现] 从对齐到执行: grill-me + goal, AI 编码的完整工作流
先想清楚,再放手让 agent 跑 上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样,把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题: 对齐 。 但对齐只是第一步。你花了半小时
对齐 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 11 篇相关文章
先想清楚,再放手让 agent 跑 上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样,把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题: 对齐 。 但对齐只是第一步。你花了半小时
先想清楚,再放手让 agent 跑 上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样,把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题: 对齐 。 但对齐只是第一步。你花了半小时
为了防止有二次倒卖的坏人洗仓库,用AI偷改代码闭源投平台吃米。佬友们有什么妙招吗? 目前知道的办法 是想办法写石山把它的上下文窗口占满 在代码里藏威胁性的英文注释块。 在代码里塞一些无关紧要的虚假敏感身份信息? 佬友们能出一些招式吗? 2 个帖子 - 2 位参与者 阅读完整话题
anthropic.com Donating our open-source alignment tool Updating Petri to version 3.0 and donating it to Meridian Labs 我们还为 Petri 找到了新的归宿。我们已将
万众期待的 Gemma 4 越狱破解版 终于发布了! Gemma-4-31B 现已 彻底破解并完成对齐抹除 版本名:Gemma-4-31B-JANG_4M-CRACK HarmBench 安全基准规避率 93.7%(149/159) 原生基础模型,纯净无杂质 适配苹果自研芯片,提
从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话 继续讨论: 省流: 内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇 随着不断迭代,就变成了如今这个样子 我倒是没见过() 因为是英文用户专属() 文源APPso
以下为项目介绍正文内容,AI生成 主要适合个人使用,为了个人使用 coding 出来的 大家有需要的可以试试 https://github.com/WeiYYin/NeonNocturne 5 个帖子 - 3 位参与者 阅读完整话题
UK Biobank - UK Biobank 和 中国慢性病前瞻性研究China Kadoorie Biobank 5 个帖子 - 3 位参与者 阅读完整话题
梦为什么会在这个时候出现 梦到的"河对岸"“同行一段”“终点分离”,其实非常典型: 河:象征已经隔开的世界 同行:你心里仍然在延续的那条线 分离:现实已经给出的答案 再加上醒来刚好生病(发烧本身就容易触发情绪性梦境), 这更像是一次"情绪收束&quo
DSv4降价消息一出来,瞬间瘫坐在椅子上,仿佛看到了原子弹爆炸一样 咳咳,总之,本篇是笔记分享系列的第二期,本系列是用以促进自己精读论文的动力(读多论文就留下了扫读的坏习惯),希望每次阅读时,能够细心一些分析有价值的论文,并将这些感悟记录下来,留给有需要的佬友。本论文分享系列会一
他是怎么一本正经的得出 9.9-9.11 结论的??? 以下是它的回复 对齐小数位:9.9 = 9.90 列竖式:9.90 - 9.11 因为 9.90 < 9.11,结果为负,换成 -(9.11 - 9.90) 9.11 - 9.90 = 0.21 所以 9.90 - 9