私有化部署大模型的“终点”是 Mac 还是 Nvidia?
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
OK - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第57页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 2800 篇相关文章 · 第 57 / 140 页
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
配置为 m1max 64g+1T ,最近搞了个小小龙虾,消耗的 token 太快了,打算部署各本地模型,一来了解了解,而来是想做下简单的翻译、文档处理的工作。能有合适的本地模型吗?
配置为 m1max 64g+1T ,最近搞了个小小龙虾,消耗的 token 太快了,打算部署各本地模型,一来了解了解,而来是想做下简单的翻译、文档处理的工作。能有合适的本地模型吗?
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
蹬了一天,可怕的token量,坐等放假了 8 个帖子 - 4 位参与者 阅读完整话题
抽奖主题: 小米百万亿token活动pro套餐 奖品详情: [奖品]:小米百万亿token活动的pro套餐的api-key 活动时间: 开始时间:2026年4月30日17:30 截止时间:2026年4月30日20:00 参与方式: 在本帖下回复任意内容。 抽奖规则: 每位用户仅允
之前中了一个月的pro,想美美使用结果发现好像不掉token? 然后站内又听说可以再免费续一个月,结果发现他竟然还会倒付给我定量的token? 14 个帖子 - 11 位参与者 阅读完整话题
IT之家 4 月 30 日消息,HMD Global 旗下一款全新诺基亚品牌功能机目前已现身工信部,参考机身外形,预计该机为 2026 款诺基亚 125。 参考工信部公示图,该机背部采用了类似 Lumia 830 的“奥利奥”风格摄像头设计(QVGA 单摄 + 闪光灯)。同时,预
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
花不完,根本花不完,五一直接估计不会很卡,有没有可能五一其中A/发现请求量大大减少 2 个帖子 - 2 位参与者 阅读完整话题
配置为 m1max 64g+1T ,最近搞了个小小龙虾,消耗的 token 太快了,打算部署各本地模型,一来了解了解,而来是想做下简单的翻译、文档处理的工作。能有合适的本地模型吗?
这里其实有个坑点,很多佬以为的credit量就是输入+输出,缓存应该是免掉的,但其实缓存是直接计数的,而且是和输入输出一样都是按1单位计数的,也就是无论是输入输出还是缓存,在小米这个token plan里是一样的。(或者再简单理解,你就当缓存是不存在的也好) 那么就会有人说了,那
https://wap.gd.10086.cn/ech/h5/token-prduct/index.html#/ 活动名额有限,活动期间每用户限办理一个产品,到期自动失效。 支持OpenAI API生态,无缝接入OpenClaw、Cursor等主流AI工具。 支持MiniMaxM
有个问题就是目前l站除了不少2api的项目:grok2pi\chatgpt2api\deepseek2api等,为什么不做一个聚合版的2api呢?有了解的大佬解释下不?我现在想法害挺多的 1 个帖子 - 1 位参与者 阅读完整话题
速度还可以,功能也还行,多模态、TTS都能用,API也很稳定,并发高一点也不怎么爆错。优点很多,缺点就是消耗的速度太快了,不管是七亿的还是十六亿的,基本上用不了几天就不够用了,再加上没缓存、Pro的倍率翻倍,薅完之后就是不太想续费(对我而言) 6 个帖子 - 6 位参与者 阅读完
配置为 m1max 64g+1T ,最近搞了个小小龙虾,消耗的 token 太快了,打算部署各本地模型,一来了解了解,而来是想做下简单的翻译、文档处理的工作。能有合适的本地模型吗?
IT之家 4 月 30 日消息,北京时间今天下午,外媒 Sammobile 爆料称,三星正在开发 基于安卓的 Galaxy Book 笔记本电脑 ,搭载基于安卓 17 的 One UI 9。 三星目前已经有 基于 ChromeOS 的 Galaxy Chromebook 。接下来
我这个套餐是不是最惨的了, 16 个帖子 - 15 位参与者 阅读完整话题