Diffusion Meets Flow Matching 论文精读
PaperGenAI
从同一条概率路径出发,系统理解 Diffusion 的噪声预测与 Flow Matching 的速度场预测为何本质等价,并结合最小代码实战串起理论与工程。
3 articles tagged with GenAI
从同一条概率路径出发,系统理解 Diffusion 的噪声预测与 Flow Matching 的速度场预测为何本质等价,并结合最小代码实战串起理论与工程。
以 Movie Gen 与 Hunyuan Video 为例,系统拆解视频生成的数据引擎:为什么要做质量过滤、运动过滤、去重重采样、结构化字幕与镜头标注,以及这些设计如何直接影响模型的可控性与能力边界。
以 Movie Gen 与 Hunyuan Video 为例,系统梳理视频生成模型的内部工作流:为什么必须先压缩到 latent 空间,patchify 与位置编码如何组织时空 token,文本条件与时间条件怎样进入 Transformer,以及 Flow Matching 在训练和推理时到底在学什么。