[Local LLM] 部署本地模型 token 输出万能公式
比如看 dgx spark 这台机子,部署 31B BF16 gemma 这台机子的带宽 273 GB/s 31B 参数 × 2 bytes (BF16) ÷ 273 GB/s = 每个 token 227 ms = 理论最大 4.4 token/s 实际能到 3token/s
比如 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第12页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 245 篇相关文章 · 第 12 / 13 页
比如看 dgx spark 这台机子,部署 31B BF16 gemma 这台机子的带宽 273 GB/s 31B 参数 × 2 bytes (BF16) ÷ 273 GB/s = 每个 token 227 ms = 理论最大 4.4 token/s 实际能到 3token/s
佬友们,想要入门渗透,逆向,比如怎么绕过登陆系统爬取信息之类,应该从哪开始学? 2 个帖子 - 2 位参与者 阅读完整话题
不知道和直接问区别大不大,比如让他读日志修bug有必要开计划模式吗? 我的意思是小任务开了会不会更好一些 有没有佬分享一下心得 7 个帖子 - 7 位参与者 阅读完整话题
比如 codex 跟 opencode ,以前都可以的,直接在windows上截图然后往对话框粘贴就行,各位道友有何高见 8 个帖子 - 5 位参与者 阅读完整话题
https://www.v2ex.com/d/ 不仅是单词,短语的发音也有,比如: https://www.v2ex.com/d/self-efficacy
https://www.v2ex.com/d/ 不仅是单词,短语的发音也有,比如: https://www.v2ex.com/d/self-efficacy
比如xxxxxx@outlook.com----xxxx----xxxxx----rt_xxxxx 这个内容怎么转换成cpa能用的认证json? 6 个帖子 - 5 位参与者 阅读完整话题
比如我进行推广,然后赚佣金? 不要赚积分。 3 个帖子 - 2 位参与者 阅读完整话题
大佬们有没有好用的网站视频下载工具、插件、脚本等等的推荐啊,比如可以下载抖音、小红书、B站;外网的像youtube、推特等等上面的视频。 15 个帖子 - 10 位参与者 阅读完整话题
现在好像机场都不怎么稳定,尤其是使用标准的比如clash之类的订阅都很卡,极其不稳定,所以现在机场都推出了自建的客户端,现在风声很紧了吗? 8 个帖子 - 8 位参与者 阅读完整话题
2d素材呀,比如绘制一些风格多,规范行走图、动图之类的也行 ,或者图生图拿到稳定一致性的多帧素材 3 个帖子 - 2 位参与者 阅读完整话题
比如同时有一个 Claude Opus 4.6 和五个 gpt 5 mini 在干活,会不会导致被封号?如果使用非官方客户端呢?
目前感觉传统GUI开发,比如QT进行类似工控软件开发,使用CC或者CODEX太难了。当前的skills或者相关配套。大多是针对WEB网页相关的。而我在进行对已有GUI界面修改,或者新增GUI程序。总是发现AI似乎做的一团糟。要求的东西总是做不好。反复的返工。token耗费一大堆,
比如输入: “我想生成一张赛博朋克风格的女性角色,4K分辨率” ↓ claude code或openclaw能够操作comfyui: 理解意图 → “txt2img + upscale” workflow 提取参数 → style=“cyberpunk”, subject=“fe
佬们,有些地区(比如菲律宾、加拿大)想在这些区消费,怎么添加付款方式呢?目前有众安银行和汇丰银行的卡,但是都被拒了 4 个帖子 - 4 位参与者 阅读完整话题
比如逆哪个平台等等。我觉得GLM5.1真的挺不错的,但是奈何太贵了。 哪怕不coding,只是接到我们团队自己内部用的小产品内部,一天都能花200多 3 个帖子 - 2 位参与者 阅读完整话题
最近五一前要去趟香港,目前知道推荐做的事有: 1.办卡,汇丰现在需要有1万港币才不收管理费,感觉有点麻烦,要是忘记就被反薅了,还是决定只办中银就好了; 2.买iPhone,可以使用AI和esim卡,就是这个esim卡不知道用处大不大,如果只是科学的话就不太值,还占了一个卡位; 佬
事情是这样的,我看到LDC小点里面有提供情绪价值的商品,比如: 有卖智力+1的…还有卖智力-1的 也有卖好感度的 所以想来问问佬友 我能卖寿命吗 这个应该不违规吧 7 个帖子 - 6 位参与者 阅读完整话题
最近在用cpa的时候发现,cpa对国产模型的适配度不是很高,比如minimax和glm等偶尔有空回复的情况,minimax2.7必现,想问问各位佬友有没有其他适配国产模型的项目平替呢 7 个帖子 - 4 位参与者 阅读完整话题
文档是日常工作的运维知识点。 比如设置 ssh 免密登陆、设置 sudo 权限、git 的常用操作、等等。 暂时用这些文档来,后续想把公司业务流程放进去。 先后试了 obsidian 和 anythingllm ,都不能达到目的。 我想要的是:我输入一个关键词,它能找到相关文档。