当前位置: 首页 > news >正文

HiWave:无需额外学习即可生成 4K 图像的小波扩散创新]

摘要

本文提出的 HiWave 是一种使用预先训练的扩散模型生成超高分辨率(如 4096 x 4096)图像的方法,无需额外的训练或架构修改。

虽然现有的基于补丁的方法可以增强局部细节,但容易造成整体结构的破坏和重叠伪影。

HiWave 首先生成低分辨率的基础图像,然后将其放大到高分辨率,并对每个补丁应用 DDIM 反变换来估计初始噪声。此外,在频域中,低频分量用于保存结构,而高频分量则用于增加细节信息。

在人体评估实验中,发现所提出的方法比传统方法质量更高,因此是高分辨率图像合成的一种新方法。

建议的方法

HiWave 包括三个阶段:基础图像生成、片段式 DDIM 反转和基于小波的细节增强。

首先,使用预先训练好的扩散模型(如 Stable Diffusion XL)生成 1024 x 1024 的基础图像,然后通过插值将图像空间放大到 4096 x 4096。

然后将放大后的图像划分为多个补丁,并对每个补丁进行 DDIM 反变换,以获得反映原始图像结构的初始噪声。

最后,使用 DWT(离散小波变换)对低频成分进行约束以保留结构,并根据 CFG(无分类器引导)对高频成分进行修正以增强细节。

通过对每个频率应用不同的引导,成功实现了整体图像的一致性和高细节增强。

实验

为了验证 HiWave 的有效性,我们进行了与 Pixelsmith(基于补丁)和 HiDiffusion(基于直接推理)的对比实验。

为了进行评估,从 LAION2B-en-aesthetic 数据集中随机选取了 1,000 个提示,每种方法都生成了 4096 x 4096 分辨率的图像。
目测比较结果显示,HiDiffusion 产生的图像结构破碎、纹理模糊,而 Pixelsmith 则倾向于产生重复的对象。

相比之下,HiWave 在保持结构完整性的同时,还具有较高的细节精确度,并大大减少了伪影的产生。此外,用户还进行了 A/B 测试,在 81.2% 的情况下,HiWave 比其他方法更受欢迎。

这从定量和定性两方面证实了所提出方法的高质量和自然的高分辨率图像生成性能。

http://www.cnnetsun.cn/news/61133.html

相关文章:

  • 数据处理服务:G1/ZGC如何提升稳定性
  • 18、使用 Neutron 创建独立路由器
  • 什么是回溯算法
  • 7、OpenStack网络配置与Linux桥接网络详解
  • Web服务器性能优化终极指南:快速提升响应时间
  • 古城景区管理|基于springboot + vue古城景区管理系统(源码+数据库+文档)
  • 腾讯开源HunyuanVideo-Avatar:一张照片+14秒音频,开启数字人创作全民时代
  • AI提示词实战技巧:从新手到专家的五个关键突破
  • agsXMPP使用
  • HTML图像与多媒体:img、picture、figure、video标签深度解析
  • 区块链 Web3 外包开发公司
  • Claude Code Router智能路由系统:5步实现多AI模型自动调度
  • 3天掌握专业RAW照片处理:darktable零基础快速上手指南
  • CogAgent-9B:2025年视觉语言模型的GUI交互革命
  • Awesome-CV模板完全攻略:打造专业双语简历的终极方案
  • PowerShell自动化运维终极指南:系统管理的革命性工具集
  • 解锁Discord隐藏权限:从用户视角到管理视角的无缝切换
  • 35亿参数重构边缘智能:Liquid AI LFM2-350M开启终端AI效率革命
  • AI产品经理思维揭秘:普通人如何转型成为未来10年最抢手的职业人才!
  • 大语言模型开源突破终极指南:从万亿参数到产业落地
  • 专业的外贸推广电话
  • SimHei字体下载完全指南:轻松解决中文显示难题
  • 基于springboot + vue学习测评系统(源码+数据库+文档)
  • 基于springboot + vue医院管理系统(源码+数据库+文档)
  • Wan2.1视频生成AI:重新定义个人视频创作的新纪元
  • 介绍最近“十大元数据管理工具”
  • 深度学习模型推理加速终极指南:从瓶颈诊断到部署实战
  • 电商系统中的日期转换实战:Date与LocalDate互转
  • 1小时开发:用Pytdx打造简易股票分析看板
  • ms.js终极指南:3分钟掌握JavaScript时间转换技巧