<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI 基础 on 图灵派对</title><link>https://turingparty-ai.pages.dev/categories/ai-%E5%9F%BA%E7%A1%80/</link><description>Recent content in AI 基础 on 图灵派对</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 02 Jan 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://turingparty-ai.pages.dev/categories/ai-%E5%9F%BA%E7%A1%80/index.xml" rel="self" type="application/rss+xml"/><item><title>5 分钟搞懂 Transformer 的自注意力机制</title><link>https://turingparty-ai.pages.dev/posts/20260102/</link><pubDate>Fri, 02 Jan 2026 00:00:00 +0000</pubDate><guid>https://turingparty-ai.pages.dev/posts/20260102/</guid><description>&lt;p&gt;Transformer 是几乎所有现代大模型的基石。理解它的核心——自注意力机制（Self-Attention），是入门 AI 的必经之路。&lt;/p&gt;
&lt;h2 id="核心思想"&gt;核心思想&lt;/h2&gt;
&lt;p&gt;一句话概括：&lt;strong&gt;让每个词都能&amp;quot;看到&amp;quot;句子中的所有其他词，并决定该关注谁。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;传统的 RNN 只能按顺序处理文本，信息传递像接力赛。而自注意力让所有位置并行交互，效率和效果都大幅提升。&lt;/p&gt;
&lt;h2 id="qkv-三剑客"&gt;Q、K、V 三剑客&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Query（查询）&lt;/strong&gt;：我在找什么？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Key（键）&lt;/strong&gt;：我有什么特征？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Value（值）&lt;/strong&gt;：我的实际内容是什么。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;计算过程就是 Q 和 K 做点积算相似度，再用这个权重去加权 V，就得到了融合了上下文信息的新表示。&lt;/p&gt;
&lt;p&gt;就这么简单。剩下的多头注意力、位置编码都是在这个基础上的扩展。&lt;/p&gt;</description></item></channel></rss>