私有化部署大模型的“终点”是 Mac 还是 Nvidia?
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
nv - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第16页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 396 篇相关文章 · 第 16 / 20 页
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
用的app(?), 报错信息: {“error”:{“message”:“Invalid Value: ‘tools.tool_search.description’. Server-executed tool_search does not accept a descripti
最近用 vibe coding 做了一个小工具: SVG to PNG Converter 。 地址: https://svg-to-png.io 起因很简单。我平时经常会遇到一些 SVG 需要转 PNG 的场景,比如图标、logo 之类。刚好现在 vibe coding 盛行,
image2调用方式有两种:一种是调用 /f/conversation 网页对话api,一种是调用 /codex/responses codex对话api。 gpt free账号具有网页生图额度,但是不具有codex生成图片额度: 非gpt free账号同时具有网页生图额度和co
目前我有两张2080ti22g,不知道能不能nvlink双卡交火 如果可以的话就有44g的显存了,配合vllm,应该可以部署一个量化后的模型,并且可以拥有较高的上下文 有没有哪位佬试过两张2080ti22g双卡交火的佬,可以来说一下经验 1 个帖子 - 1 位参与者 阅读完整话题
nvidia/nemotron-3-nano-omni-30b-a3b-reasoning:free poolside是下面公司出的 laguna-m.1 应该这个效果会好点 Poolside Introducing Laguna XS.2 and Laguna M.1 We’r
一句话总结:Envis 是一款面向开发者的新一代多语言版本管理工具,它在理念上与 asdf 类似,但提供了图形用户界面( GUI ),试图降低项目环境配置的门槛。 几乎每一个开发者都会遇到这个痛点:如何方便、快速地搭建和配置开发环境。想象一个场景,在新的工作环境或者新的项目开始时
一句话总结:Envis 是一款面向开发者的新一代多语言版本管理工具,它在理念上与 asdf 类似,但提供了图形用户界面( GUI ),试图降低项目环境配置的门槛。 几乎每一个开发者都会遇到这个痛点:如何方便、快速地搭建和配置开发环境。想象一个场景,在新的工作环境或者新的项目开始时
昨天一个很难的 bug,浏览器 canvas 和 node-canvas 不一致的问题, 24分钟,它真的在那里一点点研究:不断的提出猜想,执行命令截图验证,最终改好了 真的牛逼,感觉已经从写代码,上升到了解决问题的层次 8 个帖子 - 6 位参与者 阅读完整话题
问下佬们 cnvd4.27归的档 事件型高危 有原创证书嘛 资产远超5000w了(应该是属于通用但是交的事件) 1 个帖子 - 1 位参与者 阅读完整话题
昨天NVIDIA 模型deepseek-v4相关的模型还是Free Endpoint。今天发现已经取消了标签Free Endpoint,而且v4-flash从昨天开始一直是不可用状态 2 个帖子 - 2 位参与者 阅读完整话题
github.com GitHub - warpdotdev/warp: Warp is an agentic development environment, born... Warp is an agentic development environment, born ou
没想到今天warp开源了 github.com GitHub - warpdotdev/warp: Warp is an agentic development environment, born... Warp is an agentic development environ
背景 注册了 nvidia , win11 build.nvidia.com Try NVIDIA NIM APIs Experience the leading models to build enterprise generative AI apps now. 想在claud
IT之家 4 月 28 日消息,NVIDIA(英伟达)北京时间今晚正式发布了 GeForce RTX 5070 笔记本电脑 GPU 的 12GB 显存版本, 该版本将与现有的 8GB 显存版本同步销售 。 英伟达表示 GeForce RTX 显卡的市场需求持续旺盛,显存供应整体紧
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用
Demo arrival-space html-in-canvas-cracks 解决了哪些问题 Web 开发者在处理 Canvas 内容时长期面临一个尴尬的现实:Canvas 擅长像素级操作,但对 HTML 的布局能力一无所知。这导致了几个核心问题: 可访问性的缺失 - 当你用