S
时光的枳树
首页
博客
项目
关于
◐
主题标签
Training
这里聚合了该主题下的全部相关文章。
2026-04-16
Transformer 训练与推理:为什么训练快、生成却慢
同样是 Transformer,训练和推理的计算模式差异很大。本文解释其背后的原因与工程影响。