图像生成

图像生成分支：扩散模型基础、Stable Diffusion、DALL-E系列、Midjourney、ControlNet与LoRA、图像生成应用实践

知识点(6 个)

扩散模型基础

理解扩散模型的核心原理，掌握去噪扩散概率模型(DDPM)的数学基础和实现方法。扩散模型原理：前向扩散与反向去噪过程；DDPM数学推导：马尔可夫链、高斯噪声；噪声调度：线性、余弦、二次调度；训练目标：预测噪声 vs 预测得分；扩散模型 vs GAN：生成质量与多样性权衡。

点击查看详细资源列表

Stable Diffusion

8 资源

掌握Stable Diffusion的核心架构和使用方法，包括U-Net、VAE、CLIP文本编码器的协作机制。Stable Diffusion架构：Latent Diffusion、U-Net、VAE；文本编码：CLIP文本编码器、Prompt设计；采样器：DDIM、Euler、DPM++等采样方法；参数调节：步数、CFG Scale、种子；模型变体：SD1.5、SD2.1、SDXL、SD3。

点击查看详细资源列表

DALL-E 系列

12 资源

理解OpenAI DALL-E系列模型的技术演进，掌握DALL-E 3的最新能力和API使用方法。DALL-E技术演进：DALL-E 1/2/3的发展历程；DALL-E 3特点：与ChatGPT集成、提示词优化；API使用：图像生成、编辑、变体；与Stable Diffusion对比：闭源 vs 开源；商业应用：版权、安全、使用限制。

点击查看详细资源列表

Midjourney

10 资源

掌握Midjourney的艺术化图像生成能力，理解其提示词语法和风格控制方法。Midjourney平台特点：艺术风格、高质量输出；命令语法：/imagine、参数、版本选择；提示词结构：主体、风格、参数组合；高级参数：--ar、--s、--c、--seed；变体与放大：Vary、Upscale、Pan。

点击查看详细资源列表

ControlNet 与 LoRA

7 资源

掌握图像生成的精确控制技术，理解ControlNet的结构引导和LoRA的风格迁移方法。ControlNet原理：额外条件输入控制生成；ControlNet类型：Canny、Pose、Depth、Normal等；LoRA原理：低秩适配微调风格；LoRA训练：数据准备、训练流程；ControlNet + LoRA组合使用。

点击查看详细资源列表

图像生成应用实践

7 资源

掌握图像生成技术的实际应用方法，涵盖产品设计、内容创作、电商等典型场景。产品设计：概念图、原型可视化；内容创作：插画、海报、社交媒体素材；电商应用：商品图、模特换装、场景渲染；游戏开发：角色设计、场景概念图；建筑设计：效果图、空间可视化。

点击查看详细资源列表