[Local LLM] 私有化部署大模型的“终点”是 Mac 还是 Nvidia?
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
LM - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第8页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 895 篇相关文章 · 第 8 / 45 页
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
智谱 GLM Coding Plan 天天陪跑! 请问大家有什么方式吗?
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
我在使用GLM Coding Plan,数小时内完成过去需要数周的开发工作,赠送你1张7天AI Coding体验卡,一起来用吧: 智谱AI开放平台 5 个帖子 - 4 位参与者 阅读完整话题
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
最近搭了一个 LLM API 中转站: zerofra.me 地址: https://api.zerofra.me/ 目前主要支持: Codex / GPT 系列模型 Claude 系列模型 现在刚上线,想先邀请大家试用一下,也顺便帮忙反馈问题。 新用户注册后送 $10 测试额度
“IT早报”时间,大家好,现在是 2026 年 4 月 30 日星期四,今天的重要科技资讯有: 1、DeepSeek 终于能“看图”了!灰度“识图模式”,图片理解功能内测 DeepSeek 正在灰度测试“识图模式”,该模式和“快速模式”“专家模式”并列,并非简单的 OCR 文字,
失去竞技场claude4.6opus-think让人再没有希望 公益API很少见思考 哪怕是付费站 大部分是反代渠道 反重力什么的 通通是代码agent 自带提示词 严重问题 在chatbox中大概率会导致自己的system提示词失效 AI无法接收 只能放到user信息里 有时不
deepseek v4 pro ≈ GLM5.1 > MiMO-2.5Pro > DeepSeek V4 FLASH 。 一个真实的中型项目,处于开发阶段,心血来潮使用四个官方来源的API接口使用同一套提示词进行review, 然后将其检查报告发给gpt 5.5 打分
这是gpt-5.5@xhigh一批8次提交写的爬虫-解析-落库流水线代码,流程和功能都不复杂。 因为各家模型的思考强度映射不一样,统一开了max effort。 小米耗时4分钟 全程在说对对对干得好,最后挑了点无关痛痒的代码风格小毛病。 DSV4耗时12分钟 找到了一些非关键问题
最近免费的glm用的都不稳,然后突然想到国产模型还有个好地方就是魔搭社区,每天每个模型500次调用,够完成我部分的需求了。于是我就把魔搭社区作为渠道接入我的New API 里,然后在 cc 里测下能力。用是能用,但是经常 429,好像大概30秒一次,一分钟 2 次的并发这样?50
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
IT之家 4 月 29 日消息,今天晚间,雷峰网发布消息称,OPPO 发布了一份“ 新成立子系列事业部 ”的公告。 IT之家从公告内容获悉,此次新成立的子系列事业部,OPPO 高级副总裁(SVP)李炳忠(Sky)为该事业部负责人,其中包含的一加和 realme 的营销服体系,由原
工作的话公司会提供kimi和glm的套餐,主要是自己平时在家里折腾点小玩意,偶尔会用到。codex现在应该是没有了,有能用在cc的kimi2.5或者glm4.7的公益站吗 4 个帖子 - 3 位参与者 阅读完整话题
或者有其他的可以用的代理吗?暂时不想买服务器了 5 个帖子 - 2 位参与者 阅读完整话题
项目是一个比较大的项目,因为一个函数调用顺序导致出现的bug,使用相同的提示词描述bug和现象,gpt-5.5,4分48秒成功确认问题并修复,deepseek v4 pro 也不知道在墨迹思考啥,46分钟成功确认问题并修复,glm-5.1和glm-5.0就是瞎分析一通,说的头头是