2026 春 · 全新中文 AI 教程

用动画
看懂 AI

看清楚机器是怎么学习的。
从最简单的回归，到最前沿的大模型。

开始学习看旗舰文章：注意力机制

理论: 6 条路径
应用: 工程落地
前沿: 研究跟读

next-token-distribution.live

温度1.00

prompt机器学习是一门

next token p(·)8 candidates · top-k

研究

31.0%

关于

22.0%

让

15.0%

通过

11.0%

使

8.0%

用

5.0%

新兴

4.0%

交叉

4.0%

↑ 实时演示：模型对下一个 token 的概率分布 · 拖动温度滑块感受采样

six tracks

系统化的学习路径

从数学基础到强化学习，6 条理论路径覆盖李航《统计学习方法》全书。配合应用篇落地工程，前沿篇跟读论文。

数学基础

从公式画起

4/4

监督学习

经典算法

4/10

无监督学习

发现结构

2/7

深度学习

万能逼近

5/8

大模型

规模涌现

0/6

强化学习

试错决策

0/6

应用 · 工程

能跑能改

把方法落到工程：怎么写 prompt、搭 RAG、做 Agent、微调一个小模型。

01大模型是怎么“说话”的Token · 采样
02Prompt 工程的边界交互
03RAG 从零搭建Embedding
04Function Calling / Tool Use结构化输出
05Agent：从 ReAct 到规划循环 · 记忆
06微调入门：LoRA 图解低秩分解

共 6 篇

进入应用工程

前沿 · 研究

paper → demo

把当月最有意思的论文拆成普通人能跑、能改的小演示。

01推理模型：从 CoT 到 o1 / R1推理
02长上下文：RoPE → YaRN上下文
03多模态：CLIP → 原生融合多模态
04后训练对齐：RLHF → DPO对齐
05MoE 与稀疏激活架构
06状态空间模型：Mamba / RWKV架构
07推理优化：量化 / 投机解码工程

共 16 篇

进入前沿研究

featured

先从这三篇开始

查看全部 →

★ New

基础 · 01 · 12 min

线性代数的几何直觉

矩阵不是表格，是空间的扭曲。拖一拖把网格扭起来，看清矩阵到底在做什么。

★ Starred

基础 · 11 · 14 min

注意力机制的可视化

Query、Key、Value 到底在做什么？拖动光标看每个 token 关注谁，温度如何改变分布。

Pending

应用 · 03 · 18 min

RAG 从零搭建

嵌入空间长什么样？检索为什么会失败？把文档切片、向量化、召回三步骤都画给你看。

动起来的概念

梯度下降、注意力、采样温度——能拖、能看、能感受。读完一篇等于把概念在脑子里跑了一遍。

双线交织

想直接上手 LLM 应用？走主线。想真正搞懂注意力机制？切到支线。两条线在关键处自动跳转。

中文原创

不是翻译。中文世界第一手的解释和类比，配套也是中文写就的代码与术语对照。

用动画看懂 AI