当前位置: 首页 > news >正文

【AI学习-comfyUI学习-第十六节-高清放大工作流-各个部分学习】

【AI学习-comfyUI学习-第十六节-高清放大工作流-各个部分学习】

  • 1,前言
  • 2,说明
    • 1:第十六节-高清放大工作流-一句话总结
    • 2:工作流更深的洞见
    • 3:什么叫“锚定扩散”?
    • 1-第十六节-高清放大工作流
      • (1)调用模块
        • 整个模块部分
      • (2)输出 提示词
      • (3)模型加载
      • (4)生成图片
      • (5)那超分模型的本质是什么
    • 2-第十六节 SD放大高清工作流
      • (1)调用模块
        • 整个模块部分
      • (2)输出 提示词
      • (3)模型加载
      • (4)生成图片
      • (5)本质是什么
  • 4,细节部分
  • 5,使用的工作流
  • 6,总结

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1:第十六节-高清放大工作流-一句话总结

先用 SD 文生图生成 512×512 的高质量原图 →
再用超分模型(4x-UltraSharp)放大到 2048×2048 →
最后保存高清图像的工作流

属于 「生成 + 后期高清化」分离式设计,非常稳。

2:工作流更深的洞见

Stable Diffusion + Latent + 超分
不是“画图技术”,
而是一种“如何让机器在复杂空间里逐步逼近合理世界状态”的方法论。

3:什么叫“锚定扩散”?

这个 SD Upscale 节点里,有一个极其关键但常被忽略的参数:

降噪强度(denoise):0.20
原图的结构是“硬约束”,是从“已有结构附近”开始微调
diffusion 只在“允许的小邻域内”搜索更优解

在用 Stable Diffusion 当一个“条件约束下的高分辨率结构优化器”

1-第十六节-高清放大工作流

(1)调用模块

整个模块部分

这回整个模块都可以截截图下了

(2)输出 提示词

ultra-detailed wildlife photo of a caracal, realistic fur texture, golden hour sunlight, 200mm telephoto lens, shallow depth of field, National Geographic style, intense eyes

(3)模型加载

(4)生成图片

(5)那超分模型的本质是什么

用的 4x-UltraSharp,它和 SD 完全不是一类模型。

超分模型的本质:

在像素空间中学习:
“低分辨率图像 ↔ 高频细节之间的统计关系”

它只干一件事:

“这里看起来像毛 → 应该补出毛的细节”

2-第十六节 SD放大高清工作流

(1)调用模块

整个模块部分

这回整个模块都可以截截图下了

(2)输出 提示词

animal

(3)模型加载

(4)生成图片

(5)本质是什么

一句话点破这张图的本质

这是一个「在像素空间中,重新回到 latent 再做一次受控 diffusion 的放大流程」

本质不是“超分”,而是:
以原图为锚点,对高分辨率 latent 进行“低噪声再生成”

这和之前那个「生成 → 超分」已经是两个层级的东西了。

4,细节部分

5,使用的工作流

(1)高清放大工作流
https://download.csdn.net/download/qq_22146161/92456081
(2)SD高清放大工作流
https://download.csdn.net/download/qq_22146161/92456087

6,总结

这也算各一个开始吧,我也在学习摸索中。

http://www.cnnetsun.cn/news/32491.html

相关文章:

  • Windows命令行工具终极指南:3分钟快速上手系统管理神器
  • 18、Unix系统进程监控与脚本实现
  • 25、磁盘分区监控与主机自动ping脚本详解
  • Android TV性能优化工具配置指南:三步告别卡顿与内存泄漏
  • Canvas动画性能优化终极指南:10个让动画流畅如丝的核心技巧
  • 320亿参数逆袭!GLM-Z1开源模型重塑企业AI推理范式
  • Microsoft Equation Editor 3.0 公式编辑器完全解决方案
  • spotDL音乐下载终极指南:从Spotify到本地的完美转换
  • springboot基于vue的题库管理系统_1jhwudo9(源码+lw+部署讲解+答辩ppt等)
  • 8、Red Hat Linux 用户管理与软件管理指南
  • LogiOps终极指南:解锁罗技设备在Linux下的隐藏功能
  • 11、Linux系统管理:RPM包构建与文件系统层级标准
  • Wan2.2-Animate-14B完全攻略:5大实战技巧让静态角色“活“起来
  • 19、Linux打印系统配置与管理全解析
  • PyTorch3D技术解析:从3D模型到逼真2D图像的高效渲染方案
  • Stable Diffusion-NCNN:高性能AI绘图工具,让文字瞬间变图像 [特殊字符]
  • USB磁盘弹出工具深度解析:提升Windows设备管理效率的实战手册
  • 如何在ComfyUI中优化VAE和采样器参数以获得更高质量图像
  • 70亿参数实现四模态实时交互:Qwen2.5-Omni重构AI人机对话体验
  • 终极免费网页音乐制作:简单上手的在线MIDI编辑器完全指南
  • vue+Spring Boot的公交查询系统的设计与实现_6b51y9tw-java毕业设计
  • 终极.NET性能优化指南:10个快速提升应用速度的简单技巧
  • 终极跨平台桌面应用开发指南:使用GPUI Component构建现代化界面
  • Windows权限提升完全手册:从入门到实战
  • 27、系统安装、救援与软件许可指南
  • 16、使用 Python 进行 RPM 编程
  • mpv命令行播放器完整安装指南:从新手到专家的终极教程
  • 5步掌握AI电影分镜制作:next-scene-qwen-image-lora-2509实战指南
  • YimMenuV2:5大模块揭秘C++20模板编程的终极指南
  • 掌握建筑环境数据科学:Ladybug环境分析工具完全指南