你们说,DeepSeek V4会搞蒸馏小模型吗
去年DeepSeek R1出的时候,还出了好几个蒸馏小模型,基座是qwen2.5和llama3,现在v4也有思维链,大概不会有R2了,正好前端时间qwen3.5和qwen3.6出了,不知道会不会继续搞蒸馏小模型,当然最好是直接拿v4 pro做个小模型 1 个帖子 - 1 位参与者
几个 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第20页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 701 篇相关文章 · 第 20 / 36 页
去年DeepSeek R1出的时候,还出了好几个蒸馏小模型,基座是qwen2.5和llama3,现在v4也有思维链,大概不会有R2了,正好前端时间qwen3.5和qwen3.6出了,不知道会不会继续搞蒸馏小模型,当然最好是直接拿v4 pro做个小模型 1 个帖子 - 1 位参与者
测了几个会话下来,发现ds v4 pro max的缓存率不断上升,从85%升到95%左右并稳定下来。 官Key显示 145.23人民币。 目前单轮对话最长已经到了500k,注意力正常,没有偏离主线。 12 个帖子 - 8 位参与者 阅读完整话题
现在好多账号都提示我试用资格,我想给ABCD等账号绑定同一个信用卡进行号池试用 2 个帖子 - 2 位参与者 阅读完整话题
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
看了几个收藏的小店,全线涨价就不说了,plus 订阅都缺货了,只有 100+的 pro ,还都没质保,所以现在手里的号等到期了以后 codex 也不能爽蹬了是嘛:(((
看了几个收藏的小店,全线涨价就不说了,plus 订阅都缺货了,只有 100+的 pro ,还都没质保,所以现在手里的号等到期了以后 codex 也不能爽蹬了是嘛:(((
claude pro 每天两个五小时窗口 40刀 感觉就问几个问题,没啥生产力,就这300元消耗了 1 个帖子 - 1 位参与者 阅读完整话题
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
佬们 有走下这条路子的人吗? 有没有人试过一张卡订阅多个号的呢? 1 个帖子 - 1 位参与者 阅读完整话题
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
请教一下各位佬,我现在有几个号想直接做成号池,使用sub2api或其他api程序的方式调用,请问这个网站部署服务器的ip和地点有什么讲究吗?推荐用sub2api还是其他api程序。最近刚入行api调用,小白求问 1 个帖子 - 1 位参与者 阅读完整话题
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
昨天在别的群看一个佬说,他们几个人买了个美西 vps,一个月100 多,挂插件注册了几千个账号。没换过ip, 没有风控,没有add phone。佬们觉得可行吗。虽然这种要付费vps,但是一个也能够注册几千个,也是值得试的。正常在电脑挂 sub2api 之类的,节点要经常换,而且效
早上充了3刀,然后在左侧菜单栏换了好几个服务,好几个号码,都收不到codex发的短信呢?是号码的问题还是ChatGPT的问题呢?各位佬请教下。 5 个帖子 - 5 位参与者 阅读完整话题
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
想问一下, vibe coding 出来的代码, 一天几千行, 真有人能每一行代码都调试到吗? 调试的时间是不是比写代码的时间还多了。 大家是怎么解决 vibe coding 后出现的问题的, 有点低概率偶现的问题, 可能一万次才出现一次。
十几个任务,能一次性完成。 就是目前上下文只有258k,基本每一两次对话就自动压缩。 8 个帖子 - 8 位参与者 阅读完整话题
我有个阿里云服务器闲置想用来养马,有几个疑问想请教下: 自建了 cpa , 但是是在谷歌云,尝试调用发现网络不通,如何在服务器配置代理来请求我的 cpa ,这样做有什么风险吗? 现在有什么教程可以学习下如何养马吗? 谷歌云赠金过期了,现在准备迁移服务器,有什么vps 推荐吗? 部
看了几个收藏的小店,全线涨价就不说了,plus 订阅都缺货了,只有 100+的 pro ,还都没质保,所以现在手里的号等到期了以后 codex 也不能爽蹬了是嘛:(((