deepseek 的脑经急转弯怎么突然就会了
我看很多群友都在拿之前的那些脑筋急转弯测deepseek的能力,我感觉是因为训练数据中有,不懂这样测能体现什么呢,或者说如果训练数据中确实没有,那它又是怎么来的这个能力呢 1 个帖子 - 1 位参与者 阅读完整话题
训练 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 124 篇相关文章 · 第 5 / 7 页
我看很多群友都在拿之前的那些脑筋急转弯测deepseek的能力,我感觉是因为训练数据中有,不懂这样测能体现什么呢,或者说如果训练数据中确实没有,那它又是怎么来的这个能力呢 1 个帖子 - 1 位参与者 阅读完整话题
比如我下载了一个模型。 然后再把我所有文档交给它,二次训练。 那么,是不是就没必要 RAG 了。 通过这个模型,我就能提问了嘛,毕竟,我的基因已经嵌入进去了。
glm5有官方technical report,deepseekv4也有英文文档。连接如下 https://arxiv.org/pdf/2602.15763 huggingface.co DeepSeek_V4.pdf 68.21 KB 19 个帖子 - 12 位参与者 阅读完整
明明 GLM 5 系列也是纯国产算力训练的(基模和后训练在 10 万张华为昇腾 910B 芯片组成的算力集群),而且支持在华为昇腾、海光、寒武纪、摩尔线程、昆仑芯、天数智芯、燧原等算力卡推理。 且不提智谱畜否,GLM 出时没什么声音,怎么 DeepSeek V4 一出,总见到有嘲
疑似: 训练使用的还是NVIDIA的显卡,推理使用的是华为的 这也是一个很大的进步了,但是大家不要混淆)刚还看到ds4暴打英伟达的帖子 5 个帖子 - 5 位参与者 阅读完整话题
GPT 5.5 发布复盘 —— 所以 GPT 5.5 是 Spud 吗?进行全新的预训练了吗? OpenAI Deployment Safety Hub GPT-5.5 System Card - OpenAI Deployment Safety Hub GPT-5.5 is a
especially国模,也算是对提高国模水平的一种帮助了(? 10 个帖子 - 9 位参与者 阅读完整话题
来源 4 个帖子 - 4 位参与者 阅读完整话题
明天 GPT-5.5 要发布了,想拿来重新试一个之前没搞定的东西,在 Isaac Lab 里用训练一个双足机器人走路(我的机器人是学校的 Booster T1 拿来玩玩,兼容性问题就处理了好久) 之前稀里糊涂调了半天,还是一瘸一拐的走,要么就是走不动。 所以:有没有什么 skil
原始新闻来源: 路透社报道 要点概括: Meta 正在给 全美员工 的电脑安装名为 MCI 的内部工具; 其会采集记录包括下拉菜单等琐碎动作的鼠标轨迹、点击与键盘输入,并 对员工屏幕内容进行偶发截图 ; 监测对象限定为“工作相关的应用和网站”; Meta 说这些数据只用于模型训练
背景 简单来说,之前是一直在用 gpt / 豆包 记录,没办法记录历史训练情况,结合历史训练,个人情况出计划。所以做了这个。 训练几天后,可以通过面板看到薄弱的地方,每周训练情况。 市面上有一些,比如 训记 等等,但是功能太多了,太乱了,我只需要一个单纯记录的工具。 微信小程序搜
TechCrunch – 21 Apr 26 Meta will record employees' keystrokes and use it to train its AI models |... Meta says that it has a new intern
4月23日消息,美国时间周三,Google正式宣布其第八代张量处理单元(TPU)迎来重大战略调整:首次将AI模型的“训练”与“推理”任务剥离,交由两款相互独立的专有芯片处理。这两款新一代处理器预计于今年晚些时候推向市场。 此举标志着Google在AI硬件领域对英伟达发起的新一轮竞
这个是生成的图片,效果真的太不错了 8 个帖子 - 8 位参与者 阅读完整话题
AI 是通过对海量数据进行训练而形成的,这些数据涵盖了人类从诞生至今所积累的丰富知识与经验,包括历史、心理学、行为学等多个领域。正如“读史可以明智”,在掌握如此庞杂信息的前提下,AI 是否在某种程度上具备一种“类预见性”?因为在人类过往的经验与规律中,实际上已经隐含了多种可能的未
在多年生产可同时用于人工智能模型训练与推理工作的芯片后,Google正将这两项任务拆分至不同处理器,这是其在AI硬件领域对抗英伟达的最新举措。Google周三宣布,将对第八代张量处理单元(TPU)做出这一调整,两款芯片均将于今年晚些时候推出。 Google高级副总裁兼人工智能与基
IT之家 4 月 22 日消息,谷歌在当地时间今日举行的 Google Cloud Next 大会上宣布推出两款定制 AI ASIC 芯片,分别是 为推理优化的 TPU 8t 和面向智能体推理工作负载的 TPU 8i ,两款芯片也有承担对方优势任务的能力。 TPU 8t 在处理大
无偿分享某师兄大模型训练营资料 链接: 百度网盘 请输入提取码 提取码: et5h –来自百度网盘超级会员v9的分享 1 个帖子 - 1 位参与者 阅读完整话题
使用的是这里面的测试文档: ⧉ 模型【大海捞针】测试!(含附件)这次肯定没有被预训练过!! 搞七捻三 (\ _ /) ( ・-・) /っ 上个贴说著名的小说可能被预训练过了 所以,这次来个肯定没有被预训练的数据集: 大海捞针测试《请不要把互联网上的戾气带来这里!》.txt (49
让ai去生成ng的样本,然后再丢给yolo训练,就能节省大量的人工、时间成本了。 1 个帖子 - 1 位参与者 阅读完整话题