深度生成模型串讲 - MystLogiainn

背景¶

还在学校做深度学习课助教的时候，生成模型一直是一个需要高频答疑的模块，我认为原因包括但不限于：

它难：前面的各种分类回归模型，只要懂一句“从输入特征端到端拟合你想要的输出”，一比一地翻译为“输入 -> 输出 -> loss -> backward”就好；但在生成模型部分，课件上通常会先有一些公式推导需要你搞明白，并不好直接翻译成代码流程；
它火：我奶奶都会跟我问问 ai 怎么能对话怎么能画画怎么能说话，毋庸置疑地出圈；
它有意思：生成模型实现出来的效果，确实能激发人很多脑洞。

所以在当助教的时候，我一直有个计划是重构生成模型部分的课件和作业，让这一部分的讲述更层层递进，门槛更低一些，（也是对得起大家在评教时给我的高分）。但这事一直推迟跳票，到了自己毕业。

思来想去，我想把相关的思考写成文章分享出来，放到互联网上。希望能帮到修课的后辈学弟学妹，以及刷到这篇文章并感兴趣的你，也希望能在写文章的输出过程中反刍知识，提升理解。

可能需要的前置知识：

希望读者读完系列文章后能做到“理解主流生成模型原理”，半量化地来说是：

当然这也是给自己文章的写作的小要求，希望自己能达到。