分享一下最近琢磨出来的复杂任务分析处理skill

前言+思路来源 昨天我看论文的时候,看到一个很有意思的概念:“元编程”。其含义大概就是opus等处理完全没见过的编码语言问题时,会先将问题转化成python等他熟悉的语言脚本编写问题。然后再用脚本输出答案,而不是直接去编码,大大提高了正确率。 我就在想,对于ai来说,复杂任务的分析,是不是可以参考“...
分享一下最近琢磨出来的复杂任务分析处理skill
分享一下最近琢磨出来的复杂任务分析处理skill

前言+思路来源

昨天我看论文的时候,看到一个很有意思的概念:“元编程”。其含义大概就是opus等处理完全没见过的编码语言问题时,会先将问题转化成python等他熟悉的语言脚本编写问题。然后再用脚本输出答案,而不是直接去编码,大大提高了正确率。
我就在想,对于ai来说,复杂任务的分析,是不是可以参考“元编程”的概念,再结合残差的先做一个基线,再在此基础上慢慢调优的想法,做一个复杂任务分析流程。

整体思路与实现的一些关键

先让ai将复杂问题转化成已知领域的问题,然后做一个基线的版本,再在此基础上调优,最后达到可交付版本的水准。
这样的话,也可以大幅度减少复杂任务分析时token的用量,即仅在一些关键节点时使用高性能模型,其他时候可用低性能模型。

我写了执行分工和任务等级判定模块,各位佬可以根据需求来写,包括如何判断等。
我是用的deepseek-v4-pro,所以我写的是一般都用思考等级“high”正常处理,仅在关键时刻用QQ发信息给我说要调“max”来进行更为复杂的处理。各位佬可以用不同的模型,我也测了用deepseek-v4-flash来处理一般问题,在复杂的时候提醒我用/model来手动切,效果也不错(我主要是嫌麻烦再加上deepseek真的便宜吧)

整体优化与规范化我让gpt-5.5帮我做的,skill文件分享在这里,各位佬根据需要来取,我的Agent是hermes的Agent,各位佬如果用的是别的Agent还请优化一下做个适配以后再用。

我没什么工程的经验,所以可能还有很多可以优化的地方,还请各位佬看看以后觉得有问题或者有可以优化的点的话还请告诉我,我会尽快去改的。

complex-task-protocol-v5.0.0-final.zip (4.3 KB)

笔者碎碎念

哦我的上帝,这deepseek的api也太便宜了,真的还有更有性价比的模型吗

参考论文:
Frontier Coding Agents Use Metaprogramming to Adapt to Unfamiliar Programming Languages (arXiv:2606.10933)
Deep Residual Learning for Image Recognition (arXiv:1512.03385)

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文