S
时光的枳树
首页
博客
项目
关于
◐
主题标签
Attention
这里聚合了该主题下的全部相关文章。
2026-04-17
Transformer 原理入门:用直觉理解 Attention 在做什么
这篇文章不堆公式,先用直觉讲清楚 Query、Key、Value 和多头注意力的意义。