代数 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

代数 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 3 篇相关文章

用 72 小时系统性地否定自己的假设:从几何代数到因子注意力的踩坑记录

最近花了三天时间做了一个实验项目,核心问题是:能不能找到比 token embedding 更好的语义传送单元? 结果是把自己的三个假设依次否定了,但在否定过程中挖出来一个还没被否定的信号。把过程和数据分享出来,也许对做 NLP/表示学习的朋友有参考价值。 设备:双卡 4090

tech V2EX - 技术 2026-05-13 12:43:20+08:00

用 72 小时系统性地否定自己的假设:从几何代数到因子注意力的踩坑记录

最近花了三天时间做了一个实验项目,核心问题是:能不能找到比 token embedding 更好的语义传送单元? 结果是把自己的三个假设依次否定了,但在否定过程中挖出来一个还没被否定的信号。把过程和数据分享出来,也许对做 NLP/表示学习的朋友有参考价值。 设备:双卡 4090

tech V2EX - 技术 2026-05-13 11:43:20+08:00

用 72 小时系统性地否定自己的假设:从几何代数到因子注意力的踩坑记录

最近花了三天时间做了一个实验项目,核心问题是:能不能找到比 token embedding 更好的语义传送单元? 结果是把自己的三个假设依次否定了,但在否定过程中挖出来一个还没被否定的信号。把过程和数据分享出来,也许对做 NLP/表示学习的朋友有参考价值。 设备:双卡 4090

tech V2EX - 技术 2026-05-13 10:43:20+08:00