由 中转站投毒 的延伸讨论,基于NEWAPI的v1.0.0的版本进行二开,加入安全护栏板块,可针对请求侧和响应侧做安全审核,目前的方案是关键词护栏,命中关键词就拦截,并实现流式输出中的实时拦截。
效果如图,以“流年”作为拦截关键词,开启响应侧的安全护栏,输出中命中拦截词可以立刻截断输出并返回预置提示

希望作为一个抛砖引玉,想看看佬u对于安全护栏有什么好的策略。
初步想法是接入阿里云的qwen3guard的api做实时拦截,但是就可能天价水电单(后付费产品来的)可能会比小模型审核会更快
或者更便宜的方案是deepseek v4 flash(再次感谢梁圣)然后对于所有的请求都过一下ai审核,但是缺点是只能非流式或者假流式,对于用户体验会造成严重影响
1 个帖子 - 1 位参与者