理论 · 6 条路径
从公式画起
数学基础、监督学习、无监督学习、深度学习、大模型、强化学习——把核心算法的几何意义和概率视角都画给你看。
15 / 41 published · 持续更新中
数学基础
4/4监督学习
4/10- 01监督学习三要素
- 02线性回归与正则化
- 03感知机
- 04k 近邻法
- 05朴素贝叶斯
- 06决策树
- 07Logistic 回归与最大熵
- 08支持向量机
- 09提升方法:AdaBoost 与 GBDT
- 10序列标注:HMM 与 CRF
无监督学习
2/7深度学习
5/8- 01神经网络与反向传播
- 02优化器:SGD 到 Adam
- 03卷积神经网络
- 04循环神经网络与 LSTM
- 05注意力机制
- 06Transformer
- 07自编码器与 VAE
- 08GAN 与扩散模型
大模型
0/6- 01GPT 与 BERT:预训练范式
- 02Scaling Laws 与涌现
- 03Tokenizer 与嵌入空间
- 04后训练:RLHF 与 DPO
- 05Mixture of Experts
- 06推理优化:量化与投机解码
强化学习
0/6- 01马尔可夫决策过程
- 02多臂老虎机
- 03价值方法:MC / TD / Q-learning
- 04深度 Q 网络
- 05策略梯度与 Actor-Critic
- 06PPO 与 RLHF