[Local LLM] 私有化部署大模型的“终点”是 Mac 还是 Nvidia?
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
NV - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 135 篇相关文章 · 第 3 / 7 页
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
用的app(?), 报错信息: {“error”:{“message”:“Invalid Value: ‘tools.tool_search.description’. Server-executed tool_search does not accept a descripti
最近用 vibe coding 做了一个小工具: SVG to PNG Converter 。 地址: https://svg-to-png.io 起因很简单。我平时经常会遇到一些 SVG 需要转 PNG 的场景,比如图标、logo 之类。刚好现在 vibe coding 盛行,
image2调用方式有两种:一种是调用 /f/conversation 网页对话api,一种是调用 /codex/responses codex对话api。 gpt free账号具有网页生图额度,但是不具有codex生成图片额度: 非gpt free账号同时具有网页生图额度和co
目前我有两张2080ti22g,不知道能不能nvlink双卡交火 如果可以的话就有44g的显存了,配合vllm,应该可以部署一个量化后的模型,并且可以拥有较高的上下文 有没有哪位佬试过两张2080ti22g双卡交火的佬,可以来说一下经验 1 个帖子 - 1 位参与者 阅读完整话题
nvidia/nemotron-3-nano-omni-30b-a3b-reasoning:free poolside是下面公司出的 laguna-m.1 应该这个效果会好点 Poolside Introducing Laguna XS.2 and Laguna M.1 We’r
一句话总结:Envis 是一款面向开发者的新一代多语言版本管理工具,它在理念上与 asdf 类似,但提供了图形用户界面( GUI ),试图降低项目环境配置的门槛。 几乎每一个开发者都会遇到这个痛点:如何方便、快速地搭建和配置开发环境。想象一个场景,在新的工作环境或者新的项目开始时
一句话总结:Envis 是一款面向开发者的新一代多语言版本管理工具,它在理念上与 asdf 类似,但提供了图形用户界面( GUI ),试图降低项目环境配置的门槛。 几乎每一个开发者都会遇到这个痛点:如何方便、快速地搭建和配置开发环境。想象一个场景,在新的工作环境或者新的项目开始时
昨天一个很难的 bug,浏览器 canvas 和 node-canvas 不一致的问题, 24分钟,它真的在那里一点点研究:不断的提出猜想,执行命令截图验证,最终改好了 真的牛逼,感觉已经从写代码,上升到了解决问题的层次 8 个帖子 - 6 位参与者 阅读完整话题
问下佬们 cnvd4.27归的档 事件型高危 有原创证书嘛 资产远超5000w了(应该是属于通用但是交的事件) 1 个帖子 - 1 位参与者 阅读完整话题
昨天NVIDIA 模型deepseek-v4相关的模型还是Free Endpoint。今天发现已经取消了标签Free Endpoint,而且v4-flash从昨天开始一直是不可用状态 2 个帖子 - 2 位参与者 阅读完整话题
github.com GitHub - warpdotdev/warp: Warp is an agentic development environment, born... Warp is an agentic development environment, born ou
没想到今天warp开源了 github.com GitHub - warpdotdev/warp: Warp is an agentic development environment, born... Warp is an agentic development environ
背景 注册了 nvidia , win11 build.nvidia.com Try NVIDIA NIM APIs Experience the leading models to build enterprise generative AI apps now. 想在claud
IT之家 4 月 28 日消息,NVIDIA(英伟达)北京时间今晚正式发布了 GeForce RTX 5070 笔记本电脑 GPU 的 12GB 显存版本, 该版本将与现有的 8GB 显存版本同步销售 。 英伟达表示 GeForce RTX 显卡的市场需求持续旺盛,显存供应整体紧
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用