当前位置：首页 > news >正文

Pytorch图像去噪实战（七）：Noise2Noise自监督图像去噪实战，没有干净图也能训练模型

news 2026/7/3 14:39:33

Pytorch图像去噪实战（七）：Noise2Noise自监督图像去噪实战，没有干净图也能训练模型

一、问题场景：真实项目里根本没有干净图

前面几篇文章中，我们默认有 clean image，也就是干净图像。
训练数据通常是：

noisy -> clean

但在真实项目里，经常遇到一个很现实的问题：

我们只有带噪图片，没有对应的干净图片。

比如：

夜间监控图像
医学低剂量图像
老照片扫描图
工业相机采集图
用户上传的真实图片

这种情况下，如果没有 clean target，普通监督学习就很难训练。

一开始我也尝试过人工构造干净图，比如用传统滤波先处理一遍作为伪标签。
但效果很差，因为伪标签本身就模糊，会把模型带偏。

后来我采用了 Noise2Noise 的思路：

不需要干净图，只需要同一场景下两张不同噪声版本的图。

二、Noise2Noise的核心思想

传统监督去噪：

noisy_image -> clean_image

Noise2Noise训练方式：

noisy_image_a -> noisy_image_b

前提是：

两张图对应同一个干净信号
噪声是独立随机的
噪声均值接近0

模型在大量样本上学习后，会趋向恢复共同的干净结构，而不是随机噪声。

三、为什么noisy到noisy也能学？

假设真实图像是 x，两张带噪图分别是：

y1 = x + n1 y2 = x + n2

其中 n1 和 n2 是独立噪声。

训练目标：

model(y1) -> y2

因为 n2 是随机的，模型无法预测具体噪声，只能学习稳定存在的 x。

最终模型会学到接近 clean image 的输出。

这就是 Noise2Noise 最有意思的地方。

四、工程适用场景

Noise2Noise特别适合：

同一场景可多次采集
连续视频帧
医学影像重复采样
工业检测多次曝光
没有clean标签的数据

如果你只有单张带噪图，Noise2Noise不一定适合，可以考虑 Noise2Void 或 Blind-Spot Network。

五、工程目录结构

noise2noise_denoise/ ├── data/ │ ├── noisy_a/ │ └── noisy_b/ ├── models/ │ └── unet.py ├── dataset.py ├── train.py ├── eval.py └── utils.py

这里 noisy_a 和 noisy_b 中的图片要一一对应。

比如：

noisy_a/001.png noisy_b/001.png

六、数据集实现

dataset.py

importosfromPILimportImagefromtorch.utils.dataimportDatasetimporttorchvision.transformsastransformsclassNoise2NoiseDataset(Dataset):def__init__(self,noisy_a_dir,noisy_b_dir):self.noisy_a_paths=sorted([os.path.join(noisy_a_dir,name)fornameinos.listdir(noisy_a_dir)ifname.lower().endswith((".jpg",".png",".jpeg"))])self.noisy_b_paths=sorted([os.path.join(noisy_b_dir,name)fornameinos.listdir(noisy_b_dir)ifname.lower().endswith((".jpg",".png",".jpeg"))])assertlen(self.noisy_a_paths)==len(self.noisy_b_paths)self.transform=transforms.Compose([transforms.Resize((256,256)),transforms.ToTensor()])def__len__(self):returnlen(self.noisy_a_paths)def__getitem__(self,idx):img_a=Image.open(self.noisy_a_paths[idx]).convert("L")img_b=Image.open(self.noisy_b_paths[idx]).convert("L")img_a=self.transform(img_a)img_b=self.transform(img_b)returnimg_a,img_b

七、模型选择：使用UNet作为基础网络

Noise2Noise不是一个具体网络，而是一种训练方式。
这里我们用一个轻量 UNet。

models/unet.py

importtorchimporttorch.nnasnnclassConvBlock(nn.Module):def__init__(self,in_channels,out_channels):super().__init__()self.net=nn.Sequential(nn.Conv2d(in_channels,out_channels,3,padding=1),nn.ReLU(inplace=True),nn.Conv2d(out_channels,out_channels,3,padding=1),nn.ReLU(inplace=True))defforward(self,x):returnself.net(x)classSimpleUNet(nn.Module):def__init__(self):super().__init__()self.pool=nn.MaxPool2d(2)self.enc1=ConvBlock(1,64)self.enc2=ConvBlock(64,128)self.bottleneck=ConvBlock(128,256)self.up2=nn.ConvTranspose2d(256,128,2,2)self.dec2=ConvBlock(256,128)self.up1=nn.ConvTranspose2d(128,64,2,2)self.dec1=ConvBlock(128,64)self.out=nn.Conv2d(64,1,1)defforward(self,x):e1=self.enc1(x)e2=self.enc2(self.pool(e1))b=self.bottleneck(self.pool(e2))d2=self.up2(b)d2=torch.cat([d2,e2],dim=1)d2=self.dec2(d2)d1=self.up1(d2)d1=torch.cat([d1,e1],dim=1)d1=self.dec1(d1)returnself.out(d1)

八、训练代码

train.py

importtorchfromtorch.utils.dataimportDataLoaderfromdatasetimportNoise2NoiseDatasetfrommodels.unetimportSimpleUNetdeftrain():device=torch.device("cuda"iftorch.cuda.is_available()else"cpu")dataset=Noise2NoiseDataset("data/noisy_a","data/noisy_b")loader=DataLoader(dataset,batch_size=8,shuffle=True,num_workers=4)model=SimpleUNet().to(device)optimizer=torch.optim.AdamW(model.parameters(),lr=1e-4)criterion=torch.nn.L1Loss()forepochinrange(1,81):model.train()total_loss=0fornoisy_a,noisy_binloader:noisy_a=noisy_a.to(device)noisy_b=noisy_b.to(device)pred=model(noisy_a)loss=criterion(pred,noisy_b)optimizer.zero_grad()loss.backward()optimizer.step()total_loss+=loss.item()print(f"Epoch{epoch}, Loss:{total_loss/len(loader):.6f}")ifepoch%10==0:torch.save(model.state_dict(),f"noise2noise_epoch_{epoch}.pth")if__name__=="__main__":train()

九、推理代码

importtorchfromPILimportImageimporttorchvision.transformsastransformsimporttorchvision.utilsasvutilsfrommodels.unetimportSimpleUNet device=torch.device("cuda"iftorch.cuda.is_available()else"cpu")model=SimpleUNet().to(device)model.load_state_dict(torch.load("noise2noise_epoch_80.pth",map_location=device))model.eval()img=Image.open("test_noisy.png").convert("L")transform=transforms.Compose([transforms.Resize((256,256)),transforms.ToTensor()])noisy=transform(img).unsqueeze(0).to(device)withtorch.no_grad():pred=model(noisy)pred=torch.clamp(pred,0.0,1.0)vutils.save_image(pred.cpu(),"noise2noise_result.png")