推理 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn

推理 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 104 篇相关文章 · 第 5 / 6 页

Claude Code 中使用 Github Copilot 订阅的 GPT-5.4 作为推理模型有什么安全的方法吗?

如题,看到 cc switch 能使用 GPT-5.4 ,但会提示有封号风险,不太敢这么做。想问下有其他方式吗?先谢谢了。

tech www.v2ex.com 2026-04-22 21:21:06+08:00

[Claude Code] Claude Code 中使用 Github Copilot 订阅的 GPT-5.4 作为推理模型有什么安全的方法吗?

如题,看到 cc switch 能使用 GPT-5.4 ,但会提示有封号风险,不太敢这么做。想问下有其他方式吗?先谢谢了。

tech v2ex.com 2026-04-22 20:22:56+08:00

Harness实现了推理时的自进化,可不可以实现底模的训练+推理的自进化

不知道佬们有没有考虑过,包括我自己也在考虑,Harness是在推理时的自进化,即更新自己的skill,memory等等,但是我们可不可以设计一个训练时的自进化,也就是给一个各方面能力均很均衡的大模型,我给他一个任务,在选定的训练数据空间中去探索来提升自己的能力。 我知道现在的课程

tech linux.do 2026-04-22 11:34:51+08:00

codex使用cpa反代后无法切换模型和推理深度

佬们,我正在使用windows codex,操作界面上,没有模型切换,没有推理深度切换。想咨询一下。 这是我的codex配置,使用了CPA代理 我之前是用gpt账户登录的,当时是可以切换模型和推理深度。 后面team掉了,我就开始跟着站里学习注册free账户。 目前使用和聊天上确

tech linux.do 2026-04-22 00:26:09+08:00

【读书】设定系逻辑流:《人格转移杀人事件》

最近在活动中心看了本比较早的日本科幻推理小说《人格转移杀人事件》(西泽保彦),当然科幻元素只是用来铺装天降设定的外衣。 故事的前置设定是非常简单的: 进入对换圆(Switch Circle)房间的人会组成一个有顺序的循环,在循环里依序发生人格转移,人格转移的过程是在瞬间完成切换的

tech linux.do 2026-04-21 14:19:21+08:00

消息称谷歌本周发布 TPUv8 系列 AI 芯片:博通版专注高性能训练、联发科版主打高性价比推理

IT之家 4 月 21 日消息,科技媒体 Wccftech 昨日(4 月 20 日)发布博文,报道称在 TPUv8 战略上,谷歌针对不同 AI 场景,推行“双芯片”策略: 其中 TPUv8t 由博通设计,专注高性能训练;TPUv8i 由联发科设计,主打高性价比推理。 谷歌即将在

tech www.ithome.com 2026-04-21 08:59:49+08:00

谷歌正与美满电子洽谈合作 研发全新AI推理芯片

据两位直接知情人士透露,谷歌正与美满电子科技(Marvell)洽谈合作,研发两款全新芯片,旨在更高效地运行人工智能模型。其中一款为内存处理单元,设计用于配合谷歌张量处理单元(TPU)协同工作;另一款则是专为运行 AI 模型打造的全新 TPU 芯片。 这些举措凸显出,用于支撑智能体

tech plink.anyfeeder.com 2026-04-20 20:35:24+08:00

国产推理 GPU 企业曦望完成超 10 亿元融资,估值超百亿成独角兽

消息称国产推理 GPU 企业曦望完成超 10 亿元融资,估值超百亿成独角兽 - IT之家 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-20 17:41:17+08:00

消息称国产推理 GPU 企业曦望完成超 10 亿元融资,估值超百亿成独角兽

IT之家 4 月 20 日消息,据界面新闻今天报道, 国产全栈自研 AI 推理 GPU 企业曦望(Sunrise)完成新一轮超 10 亿元融资 。 据报道,本轮融资由多家产业方战投、地方国资及头部财务机构共同参与。这是 2026 年 AI 推理落地潮以来, 国内 GPU 赛道最大

tech www.ithome.com 2026-04-20 17:16:49+08:00

GPT PRO100刀为什么没有思考过程?

使用pro模型的时候看不到思考的过程,也没有追问,就显示一个正在推理,我记得这个好像是很久之前才会这样吧?自从哪一次更新后就修了,所以这个是bug嘛还是这个套餐就是阉割版啊? 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-20 15:55:28+08:00

关于claude code使用中转站公益站的gpt5.4设置推理等级xhigh的办法

用cpa反代中转站或者公益站的api就行了 不一定非要对gpt5.4设置4.7的别名 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-19 23:59:26+08:00

ollama推理怎么那么慢

ollama不就是一个逃课的llama.cpp嘛 为啥跑起来那么慢 在我机器下原生llama.cpp能比ollama快大概20-50%的样子 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-19 14:37:27+08:00

现在大模型能力越来越强,还需要设计很复杂的agent架构吗

如题,可能以前的大模型推理能力不足,在设计agent的时候可能需要去规划,执行,react的过程,但好像现在这些能力已经是大模型的基本能力了,还需要去设计很复杂的agent嘛 6 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-04-19 01:07:24+08:00

自制的AI推理能力排行榜(主观)

主观测试,仅供参考: Claude测试样例非常少,可能不太准确。 Prompt演示: 6 个帖子 - 4 位参与者 阅读完整话题

tech linux.do 2026-04-18 13:22:32+08:00

Ai继续这样发展,未来会是怎样的🤔

现在ai的能力都在变强。 那么不会产生幻觉,推理不会出错,有无限上下文窗口的ai,是否就是现在这条路的终点了? 但这还是工具吧? 真的有可能出现有“意识”的ai吗? 12 个帖子 - 12 位参与者 阅读完整话题

tech linux.do 2026-04-18 10:06:22+08:00

Mem0发布长效记忆架构研究:准确率领先OpenAI26%,推理延迟降低91%!

AI 记忆平台 Mem0 近期公开了其核心长效记忆算法的研究成果。实验数据显示,在 LOCOMO 基准测试中,Mem0 的响应准确率比 OpenAI 的内置记忆功能高出 26%,同时由于其「事实化」的检索机制,其 P95 推理延迟降低了 91%,Token 消耗量缩减了 90%。

tech linux.do 2026-04-17 19:26:36+08:00

英特尔被曝将推出工作站版 "Crescent Island" AI 推理优化 GPU

IT之家 4 月 16 日消息,消息人士 @jaykihn0 昨日爆料称, 英特尔将为其 AI 推理优化 GPU "Crescent Island" 推出工作站版本 。 英特尔在 2025 年 10 月宣布将推出面向数据中心的 "Crescent I

tech www.ithome.com 2026-04-16 09:23:33+08:00

西班牙 AI 推理芯片初创企业 Semidynamics 获得 SK 海力士战略投资

IT之家 4 月 15 日消息,总部位于西班牙巴塞罗那的 Semidynamics 是基于开源 RISC-V 指令集开发产品的 Fabless 芯片设计企业。该企业当地时间本月 8 日宣布 获得来自存储半导体巨头 SK 海力士的战略投资 。 Semidynamics 表示该企业的

tech www.ithome.com 2026-04-15 14:45:31+08:00

华为昇腾 0 Day 支持 MiniMax M2.7 模型,推理部署提供全流程支持

IT之家 4 月 13 日消息,据昇腾 AI 开发者公众号,4 月 12 日,MiniMax 正式开源其第一个自我深度迭代的模型 MiniMax M2.7。昇腾一直同步支持 MiniMax M2 系列模型,此次 M2.7 模型一经开源发布,昇腾 AI 基础软硬件即实现 0 Day

tech www.ithome.com 2026-04-13 08:32:19+08:00

中信建投:关注推理算力和商业航天发展机遇

36氪获悉,中信建投研报指出,AI算力与商业航天迎来产业加速期。算力端,应用演进深刻重构基础设施:Agent推动计算负载从GPU密集到CPU密集,数据中心CPU与GPU配比有望大幅提升;AI算力需求爆发叠加内存涨价以及产能紧张等因素,共同推动今年以来的服务器CPU缺货及涨价;大模

tech 36kr.com