当前位置: 首页 > news >正文

租用共绩算力4090实测龙猫图片编辑

本人实测发现,本地配备的 16GB 显存显卡无法运行 LongCat-Image(龙猫图片编辑)项目,即便开启 CPU offloading(CPU 卸载)功能缓解显存压力,依然因显存不足导致运行失败。
为此,我在网上寻找共享算力资源,最终选择租用 4090 显卡进行测试,所使用的算力平台为【共绩算力】(官网:https://www.gongjiyun.com/)。

值得一提的是,该平台对个人开发者提供免费算力申请的机会,降低了测试和开发的成本。

该平台创建云主机的流程十分便捷,基础镜像已预装Miniconda等开发必备软件,无需额外配置基础环境,极大节省了前期准备时间。考虑到需妥善保存项目数据,我额外开通了共享存储卷并挂载至云主机。不过结合两次创建云主机的实测体验来看,共享存储卷存在明显短板——读写速度较慢;而云主机自带的本地存储则表现更优,读写效率显著更高,建议大家根据实际需求选择存储方式。

登录云主机后,可直接参照 LongCat-Image 的官方仓库(https://github.com/meituan-longcat/LongCat-Image)执行以下安装步骤:

# 克隆项目仓库(仅拉取main分支) git clone --single-branch --branch main https://github.com/meituan-longcat/LongCat-Image cd LongCat-Image # 创建并激活conda虚拟环境(指定Python 3.10版本) conda create -n longcat-image python=3.10 conda activate longcat-image # 安装项目依赖并以开发模式安装项目 pip install -r requirements.txt python setup.py develop # 配置Hugging Face镜像并下载模型权重 pip install "huggingface_hub[cli]" export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download meituan-longcat/LongCat-Image-Edit --local-dir ./weights/LongCat-Image-Edit

环境配置完成后,运行示例脚本进行图片编辑测试:

python scripts/inference_edit.py

需要说明的是,项目代码中已内置CPU offloading机制,核心代码如下,其作用是将部分模型权重卸载至CPU,以此降低显存占用、避免出现OOM(显存溢出)错误:

pipe.enable_model_cpu_offload()# Offload to CPU to save VRAM (Required ~19 GB); slower but prevents OOMgenerator=torch.Generator("cpu").manual_seed(43)

即便开启了该优化机制,实测运行过程中显卡显存峰值占用仍达约17GB。这也印证了本地16GB显存显卡无法运行的核心原因——显存容量不足;而4090显卡的24GB显存,恰好能满足项目稳定运行的需求。

以下为本次测试的实际效果对比:
demo中编辑前的原图:

经过LongCat-Image编辑实现将“车换成摩托车”后的效果:

从编辑效果来看,整体表现十分出色:不仅成功实现了“车换摩托车”的核心需求,细节处理也相当到位,就连阴影部分都还原得自然逼真,没有出现明显的违和感。

http://www.cnnetsun.cn/news/99534.html

相关文章:

  • VirtualMonitor虚拟显示器:5分钟零成本扩展你的工作空间
  • EmotiVoice语音语调自动校正功能设想
  • EmotiVoice语音韵律词典构建方法研究
  • EmotiVoice在语音日记App中的个性化应用
  • EmotiVoice在语音邮件系统中实现个性化解锁问候
  • 基于ssm体育器材管理系统设计与实现
  • EmotiVoice在影视后期制作中的快速配音解决方案
  • 16、深入了解mdadm:软件RAID管理的利器
  • 游戏NPC对话不再单调!EmotiVoice赋能角色情感化配音
  • 情感语音合成伦理准则建议:行业共识正在形成
  • 9、深入理解 SQL:从关系数据库到词法分析
  • 15、Bison程序中的常见问题与特性解析
  • 21、纯扫描器与解析器的深入解析
  • 24、《Flex与Bison技术详解》
  • EmotiVoice语音合成服务SLA保障体系建设
  • EmotiVoice语音节奏控制技巧:快慢自如,随心所欲
  • 22、利用 Novell Evolution 管理邮件和联系人
  • 如何快速提取Android固件镜像:Firmware Extractor完整指南
  • 23、邮件服务器与DNS管理全解析
  • 21、服务器硬件 RAID 控制器管理与使用指南
  • 22、Linux硬件RAID与文件系统全解析
  • 42、Linux认证考试全解析
  • 模型即服务(MaaS)模式下EmotiVoice的变现思路
  • EmotiVoice开源语音合成引擎:让AI语音更富情感与表现力
  • 模型体积与推理速度权衡:EmotiVoice不同版本对比
  • Unitree GO2 ROS2 SDK终极指南:3天从新手到机器人开发专家
  • 高效智能视频格式转换工具:永久保存你的B站缓存处理方案
  • 电子书封面管理终极指南:Koodo Reader智能美化全流程
  • 复旦大学LaTeX论文模板fduthesis:规范学术写作的完整指南
  • 10分钟极速搭建!基于Keep的开源告警管理平台完整指南 [特殊字符]