理论 · 6 条路径

从公式画起

数学基础、监督学习、无监督学习、深度学习、大模型、强化学习——把核心算法的几何意义和概率视角都画给你看。

15 / 41 published · 持续更新中

数学基础

4/4

监督学习

4/10

无监督学习

2/7
  • 01聚类方法
  • 02奇异值分解
  • 03主成分分析
  • 04EM 算法
  • 05马尔可夫链蒙特卡罗
  • 06潜在语义分析与 NMF
  • 07话题模型:pLSA 与 LDA

深度学习

5/8

大模型

0/6
  • 01GPT 与 BERT:预训练范式
  • 02Scaling Laws 与涌现
  • 03Tokenizer 与嵌入空间
  • 04后训练:RLHF 与 DPO
  • 05Mixture of Experts
  • 06推理优化:量化与投机解码

强化学习

0/6
  • 01马尔可夫决策过程
  • 02多臂老虎机
  • 03价值方法:MC / TD / Q-learning
  • 04深度 Q 网络
  • 05策略梯度与 Actor-Critic
  • 06PPO 与 RLHF