【pytorchで深層生成モデル#6】pytorchでGAN

記事の目的

深層生成モデルのGAN(Generative Adversarial Networks)をpytorchを使用して実装していきます。ここにある全てのコードは、コピペで再現することが可能です。

 

目次

  1. 今回のモデル
  2. モデルの学習
  3. 準備
  4. モデル
  5. モデルの学習
  6. 画像の生成

 

1 今回のモデル

 

2 モデルの学習

 

3 準備

# [1]
!nvidia-smi

# [2]
# データ作成に使用するライブラリ
from torchvision import datasets
import torchvision.transforms as transforms
from torch.utils.data import DataLoader

# モデル作成に使用するライブラリ
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F

# よく使用するライブラリ
import matplotlib.pyplot as plt
import numpy as np

torch.manual_seed(1)

# [3]
batch_size = 100
n_channel = 100
n_epoch = 100

# [4]
# データの読み込み
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,)), lambda x: x.view(-1)])

root = './data'
mnist_dataset = datasets.MNIST(root=root,download=True,train=True,transform=transform)
dataloader = DataLoader(mnist_dataset,batch_size=batch_size,shuffle=True)

# [5]
# gpuの指定
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

 

4 モデル

# [6]
class Generator(nn.Module):

    def __init__(self):

        super(Generator, self).__init__()

        self.layers = nn.ModuleDict({
            'layer0': nn.Sequential(
                nn.Linear(n_channel, 128),
                nn.BatchNorm1d(128),
                nn.ReLU()
            ),
            'layer1': nn.Sequential(
                nn.Linear(128, 256),
                nn.BatchNorm1d(256),
                nn.ReLU()
            ),  
            'layer2': nn.Sequential(
                 nn.Linear(256, 784),
                nn.Tanh()
            )   
        })

    def forward(self, z):

        for layer in self.layers.values():
            z = layer(z)
        return z

# [7]
class Discriminator(nn.Module):

    def __init__(self):

        super(Discriminator, self).__init__()

        self.layers = nn.ModuleDict({
            'layer0': nn.Sequential(
                nn.Linear(784, 256),
                nn.LeakyReLU(negative_slope=0.2) 
            ),  
            'layer1': nn.Sequential(
                nn.Linear(256, 128),
                nn.LeakyReLU(negative_slope=0.2)
            ),   
            'layer2': nn.Sequential(
                nn.Linear(128, 1),
                nn.Sigmoid() 
            )    
        })

    def forward(self, x):
        for layer in self.layers.values():  
            x = layer(x)
        return x.squeeze()   

# [8]
generator = Generator().to(device)
discriminator = Discriminator().to(device)

# [9]
criterion = nn.BCELoss()

optimizerG = optim.Adam(generator.parameters())
optimizerD = optim.Adam(discriminator.parameters())

 

5 モデルの学習

# [10]
G_losses = []
D_losses = []
D_x_list = []
D_G_z1_list = []
D_G_z2_list = []

# 学習のループ
for epoch in range(n_epoch):

    for x, t in dataloader:

      # 前準備
      real_image = x.to(device) # 本物の画像データ
      noise = torch.randn(batch_size,n_channel,device=device) # ノイズ作成
      real_target = torch.full((batch_size,), 1., device=device) # 本物ラベル
      fake_target = torch.full((batch_size,), 0., device=device) # 偽物ラベル
      
      # discriminatorの学習(本物画像の学習)
      discriminator.zero_grad() 
      y = discriminator(real_image)
      errD_real = criterion(y, real_target)
      D_x = y.mean().item()

      # discriminatorの学習(偽物画像の学習)
      fake_image = generator(noise)
      y = discriminator(fake_image.detach())
      errD_fake = criterion(y, fake_target)
      D_G_z1 = y.mean().item()

      # discriminatorの更新
      errD = errD_real + errD_fake
      errD.backward()
      optimizerD.step()

      # generatorの学習
      generator.zero_grad()
      y = discriminator(fake_image)
      errG = criterion(y, real_target)
      errG.backward()
      D_G_z2 = y.mean().item()
      optimizerG.step()

      # 損失関数のリスト作成
      D_losses.append(errD.item())
      G_losses.append(errG.item())
      D_x_list.append(D_x)
      D_G_z1_list.append(D_G_z1)
      D_G_z1_list.append(D_G_z2)
    
    if (epoch+1) == 1 or (epoch+1) % 10 == 0:
      print('Epoch:{}/{}, Loss_D: {:.3f}, Loss_G: {:.3f}, D(x): {:.3f}, D(G(z)): {:.3f}/{:.3f}'
      .format(epoch + 1, n_epoch, errD.item(), errG.item(), D_x, D_G_z1, D_G_z2))

 

6 画像の生成

# [11]
# fake_image作成
generator.eval
noise = torch.randn(50, n_channel, device=device)
y = generator(noise)

# fake_image可視化
fig = plt.figure(figsize=(20,20))
plt.subplots_adjust(wspace=0.1, hspace=-0.8)
for i in range(50):
    ax = fig.add_subplot(5, 10, i+1, xticks=[], yticks=[])
    ax.imshow(y[i,].view(28,28).cpu().detach(), "gray")