训练 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

训练 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 105 篇相关文章 · 第 1 / 6 页

关于爬塔得token活动的想法

前一段时间想做个自动玩杀戮尖塔2的bot,但是实际做下来发现训练数据获取的太慢,于是项目暂停了。但是今天想到,正好手里codex额度比较充足,所以之后能不能用codex搓个mod,佬友们可以上传对局记录,再按照爬塔的层数和进阶难度给token。 突然有了这个想法,还在构思阶段,不

tech linux.do 2026-05-04 00:13:34+08:00

在用黑与白codex时,发现了奇怪的输出:黄与赌

惊奇的发现输出了一些奇怪的东西, 图中做了标注,这是codex的训练数据里有这些东西的原因吗 ,这个日日啪 什么鬼 9 个帖子 - 7 位参与者 阅读完整话题

tech linux.do 2026-05-02 20:57:54+08:00

训练如何才能保证最佳参数呢?

今天发现一个问题,最近在训练一些参数保证其最优。 之前学过一些深度学习相关知识 我做了如下操作:将数据分为 70% 训练 和 30% 测试 我告诉大模型 中间你怎么定义程序/模型 我不管 但是你要把30%验证的分数拉到最高 我发现这是错误的, 终于知道为什么有的模型分数很高但是实

tech linux.do 2026-05-02 09:47:02+08:00

【开源】4090 多卡大模型训练框架,全量微调 32B 模型提速 25 倍

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺

tech linux.do 2026-05-01 19:20:27+08:00

追觅CEO俞浩回应“全员开号”:否认微商化,称为AI时代能力训练

昨晚追觅科技CEO俞浩针对近期备受争议的“要求全体员工开通社交媒体账号”一事作出正面回应。他明确表示,此举核心目的在于锻炼员工的复合能力,助力团队在AI时代保持竞争优势,并宣布已向首批达成目标的员工兑现了现金奖励。 根据内部通知,俞浩要求公司共计两万多名员工均需在各大社媒平台开通

tech plink.anyfeeder.com 2026-05-01 14:36:11+08:00

埃隆·马斯克似乎承认 xAI 使用了 OpenAI 的模型来训练自己的模型。

WIRED – 30 Apr 26 Elon Musk Seemingly Admits xAI Has Used OpenAI’s Models to Train Its Own While answering questions under oath, Musk argued

tech linux.do 2026-05-01 14:27:59+08:00

Antigravity我真是服了 不能搞别搞了

真的不行咱就别搞了 不够恶心的 30个号写完一个想我都可以去打fps游戏了 这是搁这训练哥们定点点击呢? 9 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-05-01 14:09:36+08:00

歼-15 战斗机使用火箭弹对地实弹攻击,最新训练画面曝光

IT之家 5 月 1 日消息,央视新闻今日曝光了航空兵部队实战训练的画面,歼-15 战斗机使用火箭弹对地实弹攻击。 近日,空军某部一场下半夜拂晓异型机同场组训飞行训练拉开帷幕,突击编队率先飞往指定空域,为躲避“敌”方侦察,战机迅速下降飞行高度,利用海上超低空突防的方式向目标海域推

tech www.ithome.com 2026-05-01 13:41:30+08:00

埃隆·马斯克证实xAI 曾用OpenAI模型训练 Grok

在美国关于 OpenAI 的一场联邦诉讼中,埃隆·马斯克在证词中承认,他创立的人工智能公司 xAI 曾利用 OpenAI 的模型,通过所谓“蒸馏”(distillation)技术来训练自家聊天机器人 Grok,再次将这一原本在业内心照不宣的做法推到了聚光灯下。 近期,OpenAI

tech plink.anyfeeder.com 2026-05-01 07:05:08+08:00

通用汽车:下一代 Super Cruise 每天都用人类百年驾驶经验进行训练

IT之家 4 月 30 日消息,据外媒 insideevs 报道,当地时间 4 月 28 日,通用汽车在 2026 年第一季度财报电话会上披露,第一季度计提了 11 亿美元(IT之家注:现汇率约合 75.34 亿元人民币)费用,原因是公司正在收缩电动汽车相关计划。 在电动汽车业务

tech www.ithome.com 2026-04-30 20:16:37+08:00

将语言模型训练得温情脉脉,会降低准确性,增加谄媚性

https://www.nature.com/articles/s41586-026-10410-0 [!quote]+ 人工智能开发人员正在越来越多地建立具有温暖和友好角色的语言模型,现在有数百万人利用这些角色来获得建议、治疗和陪伴。在这里,我们展示了这种做法是如何造成重大损失

tech linux.do 2026-04-30 17:29:55+08:00

“哥布林”词频暴涨 175%,OpenAI 复盘称 AI 训练奖励机制意外“跑偏”

IT之家 4 月 30 日消息,OpenAI 昨日(4 月 29 日)发布博文,复盘发现 GPT-5.1 系列及后续 AI 模型出现异常行为,在回答中频繁使用“哥布林”(goblin)和“小魔怪”(gremlin)等生物隐喻。 OpenAI 官方调查后发现,自从 GPT-5.1

tech www.ithome.com 2026-04-30 15:52:22+08:00

科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文

ithome.com 科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文 - IT之家 星火 X2-Flash 采用 MoE 架构,总参数 30B,最大支持 256K 上下文,宣称在智能体、代码等能力上实现了大幅提升,基于华为昇腾

tech linux.do 2026-04-29 15:32:00+08:00

科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文

IT之家 4 月 29 日消息,科大讯飞星火 X2-Flash 模型今日正式发布,同步开放 API。 星火 X2-Flash 采用 MoE 架构, 总参数 30B,最大支持 256K 上下文 ,宣称在智能体、代码等能力上实现了大幅提升,基于 华为昇腾 910B 集群 训练完成。

tech www.ithome.com 2026-04-29 15:09:05+08:00

[问与答] 盲猜小米 100T 计划,是因为定价问题导致没人用,一堆卡只能空跑,训练数据也没人贡献

rt 小米的 MiMo 模型,甚至知道的人都不多。 再叠加最近 ds4 出来了,导致 MiMo 这个价格更是路边一条。

tech v2ex.com 2026-04-29 14:35:34+08:00

2025 年我国用于人工智能训练和推理的数据总量达 199.48EB,同比增长 42.86%

IT之家 4 月 29 日消息,国家数据局数据显示,2025 年,我国用于人工智能训练和推理的数据总量为 199.48EB(Exabyte,艾字节 | 1EB=1024PB=1,048,576TB),同比增长 42.86%, 推理数据量首超训练数据量 ,达 101.34EB。 另

tech www.ithome.com 2026-04-29 13:02:24+08:00

[问与答] 盲猜小米 100T 计划,是因为定价问题导致没人用,一堆卡只能空跑,训练数据也没人贡献

rt 小米的 MiMo 模型,甚至知道的人都不多。 再叠加最近 ds4 出来了,导致 MiMo 这个价格更是路边一条。

tech v2ex.com 2026-04-29 12:01:12+08:00

[问与答] 盲猜小米 100T 计划,是因为定价问题导致没人用,一堆卡只能空跑,训练数据也没人贡献

rt 小米的 MiMo 模型,甚至知道的人都不多。 再叠加最近 ds4 出来了,导致 MiMo 这个价格更是路边一条。

tech v2ex.com 2026-04-29 12:01:12+08:00

关于后训练的相关解读以及对于人工智能的一些思考

首先,把自己对AI的思考贴出来,方便和各位佬讨论讨论,附件是对论文 A Survey on Post-training of Large Language Models 的一些简要版的解读,方便大家快速了解。 后训练方法综述.pdf (2.6 MB) 首先就是,如何让模型训练走进

tech linux.do 2026-04-29 11:57:10+08:00

小米就是为了收集训练数据,本质上与longcat类似

coding可是最好的训练数据 支持开源的同时提升模型 一举多得 不论如何,总是好事 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-29 09:05:30+08:00