在站外围观许久,终是得以注册。来跟各位汇报下作为研二小登的我的Research工作流进化历程
还记得 GPT 刚出来的时候,是绿底的 OpenAI 头像配黑底 Web Chat UI,很简陋,但确实帮了我不少。那时候没有现在的各种agents 和 harness,我基本上把它当大号 CSDN 用,主要用途就是中译英和接单写代码。前者不必多说,那时候的翻译质量我觉得就很能打了,起码写毕业论文和大作业是够用的。后者主要用来写各类项目,上至本科毕设,下至纯 CLI 的xx管理系统。那时候用的 prompt 很精细,类似"用cpp写一个xx管理系统,无需 web 端,命令台展示即可。功能包括:1.xxx 2.xxx。具体实现:细节1细节2细节3…"每次一写就是一大段。效果也不错,给出来的代码基本上能直接用。现在看来,这大概算是最早的 Vibe Coding 了。
随着GPT一路进化,以及我进组时间变长,我接触到的任务也早已不止于大作业级别。作为开山弟子,导师很快就让我开始写小论文。或许是第一次带学生,导师总是默认我什么都会,基本上每次都扔给我一个我现有能力之外的任务,因此,我也被迫开始学习各类LLM技能,以求高质量高速度的完成。
慢慢地,在我的Research工作流中,人工的参与越来越少。时至今日,我的整体工作流中,我的角色甚至还没有“我与导师组会会议记录.md”的作用大。毫不客气地说,我就是导师和LLM之间的传话筒,我的作用仅是理解。这包括理解导师的很抽象的话、理解当前的科研状态、以及理解LLM的分析。在最后一点上,不得不说,GPT5.4和5.5真的给我造成了很大的阻碍,指各种非人类的口癖以及迄今为止冠绝古今中外所有LLM的造新词的能力。
回到主题上来,我目前的工作流大概是:导师给个大概方向-claudeCode/Codex搜文献调研-人工理解并提出第一版idea-GPT5.5/Opus4.8双重拷打-做实验-失败-组会汇报-导师指点-重复上述。一般迭代2-3版就差不多了(因为这时候也快到会议ddl了,再不写真勾八来不及了)
对于LLM的选择,我的理解是在推导公式方面我推荐GPT,讨论迭代idea我推荐Opus。前者不必多说,基本上属于大家的共识了。后者,虽然Opus在逻辑推理能力上并不是SOTA,但是最起码它能说人话…能够大幅减少我理解新领域/新知识的成本。另外,最近更新的Opus4.8用起来感觉还不错,个人体感来说可以替代4.6了。
想到哪写到哪了,行文难免杂乱,各位佬多担待。
最后有几个问题想和各位佬探讨下:
- 作为同是LLM研究方向的各位硕博佬,你们主推什么模型?
- 之前一直很火的DeepReasearch功能现在怎么销声匿迹了
- 像我这种科研进展全靠与LLM聊天,真的没问题么…
5 个帖子 - 4 位参与者