LLAMA - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

LLAMA - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 99 篇相关文章 · 第 1 / 5 页

投票 你现在在用什么模型

GPT 豆包 Gemini Llama DeepSeek 文心 Kimi Claude Qwen Grok GLM Gemma Composer 点击以查看投票。 你问我为什么排序这么抽象?是Gemini按使用人数列出来的顺序 无需在意 就当是为了不影响结果进行的随机排序吧 7

tech LinuxDo 最新话题 2026-05-21 11:54:08+08:00

Ollama离线部署模型

要求:有一台联网的电脑 步骤: 1.在联网的电脑安装ollama 2.在这台联网的电脑下载好模型文件,模型文件保存会至 ~.ollama目录 3.在离线的机器安装ollama 4.将联网电脑~.ollama目录所有文件,拷贝至离线电脑对应目录,cmd执行ollama list,就

tech LinuxDo 最新话题 2026-05-20 16:10:02+08:00

找一个兼职远程工作,nodejs全栈,熟悉ai大模型

两年工作经验,熟悉nodejs、react技术栈,熟悉langchain、llamaindex等ai编程框架,熟悉dify、ragflow等工作流平台;每天期望工作6小时,月薪5000即可带走 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 18:39:39+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 17:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 17:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 16:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 15:50:13+08:00

关于 5070ti 模型推理的速度和本地部署思考

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_

tech V2EX - 技术 2026-05-19 15:50:13+08:00

公司有台服务器 NVIDIA 3090两块卡

大佬们 这种配置的机器,跑那种模型合适,使用ollama还是vllm跑? 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 10:11:41+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 19:20:01+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 18:20:01+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 15:11:47+08:00

[Local LLM] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 14:52:04+08:00

有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech V2EX - 技术 2026-05-18 14:45:54+08:00

[Local LLM] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 13:10:04+08:00

[问与答] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 13:10:04+08:00

[问与答] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 12:33:52+08:00

[问与答] 有没有能够兼容 Win7 的离线模型工具

想用 ollama 或 llm studio 等工具下载个 Hugging Face 上的模型,在 windows7 中离线运行处理一些日常小需求,发现这些工具最低都是仅支持 win10/win11 ,有没有大佬研究过有没有类似的能够加载使用离线模型的兼容 Win7 的工具推荐

tech v2ex 2026-05-18 11:43:06+08:00

Github一个特性可能会有泄密的问题,做开源项目的佬们需要注意下

事情是这样的,之前在站里发过一个开源项目 [开源]ServLlama,一键让你的手机变成LLM服务器,无需Termux!功能强大堪比Ollama 开发调优 1.0.2已发布,新增了后台运行保活,加入系统电池优化白名单后,后台运行应该很长一段时间内服务都不会被冻结 而这个项目一开始

tech LinuxDo 最新话题 2026-05-18 11:10:44+08:00

有没有用ollama cloud max的佬,问个问题

现在在用ollama cloud pro,感觉速度慢的离谱,但还是每周蹬完,想问问max的速度跟pro比会快一点吗? 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-17 18:40:52+08:00