测试报告 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

测试报告 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 4 篇相关文章

ai-review-pipeline:一条命令跑完 AI Review + 自动修复 + 测试报告

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺

tech linux.do 2026-04-28 15:31:55+08:00

deepseek 测评【转发】

内测群发的: DeepSeek-V4测试报告 model1: 优势: 该模型纯编程能力远强于Kimi-k2.6和GLM-5.1 模型上下文超长,利于大量文档阅读 劣势: 该模型未经过Agent使用环境优化 特征一:“亲历亲为”:模型极少使用SubAgent,导致上下文迅速膨胀 特

tech linux.do 2026-04-24 12:29:05+08:00

k2.6单问题测试报告

已经带了 先理解需求对应代码然后并复述. 结果直接给我修改了 测试了其他情况 不带上了,例如我问了ssh服务器下载速度怎么样.结果疯狂 不同进程占用 容器占用. 思考链也特长,glm,claude,chatgpt 修改文件动作是不会出现在思考里面,Kimi连该文件代码也出现在思考

tech linux.do 2026-04-21 19:07:41+08:00

一次本地部署模型的测试结果

八个模型评测测试报告 1). 测试概述 本次测试针对以下八个模型进行了统一条件下的对比评测: Gemma-4-31B-IT-Uncensored SuperGemma4-26B-Uncensored Gemma 4 - 26B A4B x Claude Opus 4.6 Qwen

tech linux.do 2026-04-17 21:02:25+08:00