对齐 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

对齐 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 11 篇相关文章

[分享发现] 从对齐到执行: grill-me + goal, AI 编码的完整工作流

先想清楚,再放手让 agent 跑 上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样,把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题: 对齐 。 但对齐只是第一步。你花了半小时

tech v2ex 2026-05-21 09:41:09+08:00

[分享发现] 从对齐到执行: grill-me + goal, AI 编码的完整工作流

先想清楚,再放手让 agent 跑 上一篇文章聊了 Matt Pocock 的 grill-me skill——用三句话让 agent 像一个严格的 reviewer 一样,把你的方案逐个分支追问到底。它解决的是 AI 编码最核心的问题: 对齐 。 但对齐只是第一步。你花了半小时

tech v2ex 2026-05-21 08:54:34+08:00

有佬友可以分享一下,如何利用GPT,Claude等模型的安全对齐来反AI洗仓库盗用代码转投商用吗?

为了防止有二次倒卖的坏人洗仓库,用AI偷改代码闭源投平台吃米。佬友们有什么妙招吗? 目前知道的办法 是想办法写石山把它的上下文窗口占满 在代码里藏威胁性的英文注释块。 在代码里塞一些无关紧要的虚假敏感身份信息? 佬友们能出一些招式吗? 2 个帖子 - 2 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-09 03:03:15+08:00

Anthropic 捐赠开源对齐工具 Petri 至 meridianlabs

anthropic.com Donating our open-source alignment tool Updating Petri to version 3.0 and donating it to Meridian Labs 我们还为 Petri 找到了新的归宿。我们已将

tech LinuxDo 最新话题 2026-05-08 15:15:01+08:00

Gemma-4-31B 越狱版,无限制,直接下载

万众期待的 Gemma 4 越狱破解版 终于发布了! Gemma-4-31B 现已 彻底破解并完成对齐抹除 版本名:Gemma-4-31B-JANG_4M-CRACK HarmBench 安全基准规避率 93.7%(149/159) 原生基础模型,纯净无杂质 适配苹果自研芯片,提

tech linux.do 2026-05-02 11:49:57+08:00

「转载」谁在 GPT-5.5 脑子里塞了一群「妖怪」?|从gpt的哥布林事件看对齐危机

从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话 继续讨论: 省流: 内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇 随着不断迭代,就变成了如今这个样子 我倒是没见过() 因为是英文用户专属() 文源APPso

tech linux.do 2026-04-30 19:48:37+08:00

【开源工具】 NeonNocturne,对齐 SillyTavern 工作流的聊天项目:支持会话绑定、世界书、Prompt 编排、Docker 部署

以下为项目介绍正文内容,AI生成 主要适合个人使用,为了个人使用 coding 出来的 大家有需要的可以试试 https://github.com/WeiYYin/NeonNocturne 5 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-30 15:54:38+08:00

除了UKB 、CKB有ECG和gene对齐的数据库吗?

UK Biobank - UK Biobank 和 中国慢性病前瞻性研究China Kadoorie Biobank 5 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-29 22:01:29+08:00

我们曾经在同一条路上短暂对齐过方向,但没有走到同一个终点

梦为什么会在这个时候出现 梦到的"河对岸"“同行一段”“终点分离”,其实非常典型: 河:象征已经隔开的世界 同行:你心里仍然在延续的那条线 分离:现实已经给出的答案 再加上醒来刚好生病(发烧本身就容易触发情绪性梦境), 这更像是一次"情绪收束&quo

tech linux.do 2026-04-29 11:32:54+08:00

[论文随笔分享] CS-Aligner 基于柯西-施瓦茨散度的分布视觉语言对齐

DSv4降价消息一出来,瞬间瘫坐在椅子上,仿佛看到了原子弹爆炸一样 咳咳,总之,本篇是笔记分享系列的第二期,本系列是用以促进自己精读论文的动力(读多论文就留下了扫读的坏习惯),希望每次阅读时,能够细心一些分析有价值的论文,并将这些感悟记录下来,留给有需要的佬友。本论文分享系列会一

tech linux.do 2026-04-28 16:54:54+08:00

我已经被 opus 4-7 气得力竭了。。。

他是怎么一本正经的得出 9.9-9.11 结论的??? 以下是它的回复 对齐小数位:9.9 = 9.90 列竖式:9.90 - 9.11 因为 9.90 < 9.11,结果为负,换成 -(9.11 - 9.90) 9.11 - 9.90 = 0.21 所以 9.90 - 9

tech linux.do 2026-04-17 22:01:35+08:00