导航菜单
切换主题

图像生成

图像生成分支:扩散模型基础、Stable Diffusion、DALL-E系列、Midjourney、ControlNet与LoRA、图像生成应用实践

知识点(6 个)

扩散模型基础

9 资源

理解扩散模型的核心原理,掌握去噪扩散概率模型(DDPM)的数学基础和实现方法。扩散模型原理:前向扩散与反向去噪过程;DDPM数学推导:马尔可夫链、高斯噪声;噪声调度:线性、余弦、二次调度;训练目标:预测噪声 vs 预测得分;扩散模型 vs GAN:生成质量与多样性权衡。

点击查看详细资源列表

Stable Diffusion

8 资源

掌握Stable Diffusion的核心架构和使用方法,包括U-Net、VAE、CLIP文本编码器的协作机制。Stable Diffusion架构:Latent Diffusion、U-Net、VAE;文本编码:CLIP文本编码器、Prompt设计;采样器:DDIM、Euler、DPM++等采样方法;参数调节:步数、CFG Scale、种子;模型变体:SD1.5、SD2.1、SDXL、SD3。

点击查看详细资源列表

DALL-E 系列

12 资源

理解OpenAI DALL-E系列模型的技术演进,掌握DALL-E 3的最新能力和API使用方法。DALL-E技术演进:DALL-E 1/2/3的发展历程;DALL-E 3特点:与ChatGPT集成、提示词优化;API使用:图像生成、编辑、变体;与Stable Diffusion对比:闭源 vs 开源;商业应用:版权、安全、使用限制。

点击查看详细资源列表

Midjourney

10 资源

掌握Midjourney的艺术化图像生成能力,理解其提示词语法和风格控制方法。Midjourney平台特点:艺术风格、高质量输出;命令语法:/imagine、参数、版本选择;提示词结构:主体、风格、参数组合;高级参数:--ar、--s、--c、--seed;变体与放大:Vary、Upscale、Pan。

点击查看详细资源列表

ControlNet 与 LoRA

7 资源

掌握图像生成的精确控制技术,理解ControlNet的结构引导和LoRA的风格迁移方法。ControlNet原理:额外条件输入控制生成;ControlNet类型:Canny、Pose、Depth、Normal等;LoRA原理:低秩适配微调风格;LoRA训练:数据准备、训练流程;ControlNet + LoRA组合使用。

点击查看详细资源列表

图像生成应用实践

7 资源

掌握图像生成技术的实际应用方法,涵盖产品设计、内容创作、电商等典型场景。产品设计:概念图、原型可视化;内容创作:插画、海报、社交媒体素材;电商应用:商品图、模特换装、场景渲染;游戏开发:角色设计、场景概念图;建筑设计:效果图、空间可视化。

点击查看详细资源列表