next-token-distribution.live
温度1.00
prompt机器学习是一门
next token p(·)8 candidates · top-k
研究
31.0%
关于
22.0%
让
15.0%
通过
11.0%
使
8.0%
用
5.0%
新兴
4.0%
交叉
4.0%
↑ 实时演示:模型对下一个 token 的概率分布 · 拖动温度滑块感受采样
six tracks
系统化的学习路径
从数学基础到强化学习,6 条理论路径覆盖李航《统计学习方法》全书。 配合应用篇落地工程,前沿篇跟读论文。
应用 · 工程
能跑能改
把方法落到工程:怎么写 prompt、搭 RAG、做 Agent、微调一个小模型。
- 01大模型是怎么“说话”的Token · 采样
- 02Prompt 工程的边界交互
- 03RAG 从零搭建Embedding
- 04Function Calling / Tool Use结构化输出
- 05Agent:从 ReAct 到规划循环 · 记忆
- 06微调入门:LoRA 图解低秩分解
共 6 篇
进入应用工程前沿 · 研究
paper → demo
把当月最有意思的论文拆成普通人能跑、能改的小演示。
- 01推理模型:从 CoT 到 o1 / R1推理
- 02长上下文:RoPE → YaRN上下文
- 03多模态:CLIP → 原生融合多模态
- 04后训练对齐:RLHF → DPO对齐
- 05MoE 与稀疏激活架构
- 06状态空间模型:Mamba / RWKV架构
- 07推理优化:量化 / 投机解码工程
共 16 篇
进入前沿研究动起来的概念
梯度下降、注意力、采样温度——能拖、能看、能感受。读完一篇等于把概念在脑子里跑了一遍。
双线交织
想直接上手 LLM 应用?走主线。想真正搞懂注意力机制?切到支线。两条线在关键处自动跳转。
中文原创
不是翻译。中文世界第一手的解释和类比,配套也是中文写就的代码与术语对照。