LLAMA - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

LLAMA - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 99 篇相关文章 · 第 1 / 5 页

投票你现在在用什么模型

GPT 豆包 Gemini Llama DeepSeek 文心 Kimi Claude Qwen Grok GLM Gemma Composer 点击以查看投票。你问我为什么排序这么抽象？是Gemini按使用人数列出来的顺序无需在意就当是为了不影响结果进行的随机排序吧 7

tech LinuxDo 最新话题 2026-05-21 11:54:08+08:00

Ollama离线部署模型

要求：有一台联网的电脑步骤： 1.在联网的电脑安装ollama 2.在这台联网的电脑下载好模型文件，模型文件保存会至 ~.ollama目录 3.在离线的机器安装ollama 4.将联网电脑~.ollama目录所有文件，拷贝至离线电脑对应目录，cmd执行ollama list，就

tech LinuxDo 最新话题 2026-05-20 16:10:02+08:00

找一个兼职远程工作，nodejs全栈，熟悉ai大模型

两年工作经验，熟悉nodejs、react技术栈，熟悉langchain、llamaindex等ai编程框架，熟悉dify、ragflow等工作流平台；每天期望工作6小时，月薪5000即可带走 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-19 18:39:39+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 17:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 17:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 16:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 15:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 15:50:13+08:00

公司有台服务器 NVIDIA 3090两块卡

大佬们这种配置的机器，跑那种模型合适，使用ollama还是vllm跑？ 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-19 10:11:41+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 19:20:01+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 18:20:01+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 15:11:47+08:00

[Local LLM] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 14:52:04+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 14:45:54+08:00

[Local LLM] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 13:10:04+08:00

[问与答] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 13:10:04+08:00

[问与答] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 12:33:52+08:00

[问与答] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型，在 windows7 中离线运行处理一些日常小需求，发现这些工具最低都是仅支持 win10/win11 ，有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 11:43:06+08:00

Github一个特性可能会有泄密的问题，做开源项目的佬们需要注意下

事情是这样的，之前在站里发过一个开源项目 [开源]ServLlama，一键让你的手机变成LLM服务器，无需Termux！功能强大堪比Ollama 开发调优 1.0.2已发布，新增了后台运行保活，加入系统电池优化白名单后，后台运行应该很长一段时间内服务都不会被冻结而这个项目一开始

tech LinuxDo 最新话题 2026-05-18 11:10:44+08:00

有没有用ollama cloud max的佬，问个问题

现在在用ollama cloud pro，感觉速度慢的离谱，但还是每周蹬完，想问问max的速度跟pro比会快一点吗？ 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-17 18:40:52+08:00