理论 · 6 条路径

从公式画起

数学基础、监督学习、无监督学习、深度学习、大模型、强化学习——把核心算法的几何意义和概率视角都画给你看。

15 / 41 published · 持续更新中

数学基础

4/4

监督学习

4/10

01监督学习三要素
02线性回归与正则化
03感知机
04k 近邻法
05朴素贝叶斯
06决策树
07Logistic 回归与最大熵
08支持向量机
09提升方法：AdaBoost 与 GBDT
10序列标注：HMM 与 CRF

无监督学习

2/7

01聚类方法
02奇异值分解
03主成分分析
04EM 算法
05马尔可夫链蒙特卡罗
06潜在语义分析与 NMF
07话题模型：pLSA 与 LDA

深度学习

5/8

01神经网络与反向传播
02优化器：SGD 到 Adam
03卷积神经网络
04循环神经网络与 LSTM
05注意力机制
06Transformer
07自编码器与 VAE
08GAN 与扩散模型

大模型

0/6

01GPT 与 BERT：预训练范式
02Scaling Laws 与涌现
03Tokenizer 与嵌入空间
04后训练：RLHF 与 DPO
05Mixture of Experts
06推理优化：量化与投机解码

强化学习

0/6

01马尔可夫决策过程
02多臂老虎机
03价值方法：MC / TD / Q-learning
04深度 Q 网络
05策略梯度与 Actor-Critic
06PPO 与 RLHF