【pythonでCNN#2】im2col関数(strideとpadding)

記事の目的

pythonでCNN(畳み込みニューラルネットワーク)を実装する上で必要になるim2col関数を、strideとpaddingを考慮して実装していきます。ここにある全てのコードは、コピペで再現することが可能です。

 

目次

  1. 畳み込み演算とim2col(stride2, padding1)
  2. im2col関数

 

1 畳み込み演算とim2col

 

2 im2col関数

2.1 列方向の繰り返し

# In[1]
import numpy as np

# In[2]
x = np.array([[1,1,1,1],[2,2,2,2],[3,3,3,3],[4,4,4,4]])
x

# In[3]
x_p = np.pad(x, [(1, 1), (1, 1)], "constant")
x_p

# In[4]
x_col = np.zeros((2*2,3*3))
x_col

# In[5]
x_col[:,0] = x_p[0:2,0:2].reshape(-1)
x_col[:,1] = x_p[0:2,2:4].reshape(-1)
x_col

# In[6]
def im2col(x, fil_size, y_size, stride, pad):
    fil_h, fil_w = fil_size, fil_size
    y_h, y_w = y_size, y_size
    index = -1
    
    x_pad = np.pad(x, [(pad, pad), (pad, pad)], "constant")
    
    x_col = np.zeros((fil_h*fil_w, y_h*y_w))
    for h in range(y_h):
        h2 = h*stride + fil_h
        for w in range(y_w):
            index += 1
            w2 = w*stride + fil_w
            x_col[:,index] = x_pad[h*stride:h2,w*stride:w2].reshape(-1)
    
    return x_col

# In[7]
im2col(x,2,3,2,1)

 

2.2 行方向の繰り返し

# In[8]
x_p

# In[9]
x_col = np.zeros((2*2,3*3))
x_col

# In[10]
x_col[0,:] = x_p[0:3*2:2,0:3*2:2].reshape(-1)
x_col[1,:] = x_p[0:3*2:2,1:4*2:2].reshape(-1)
x_col

# In[11]
def im2col(x, fil_size, y_size, stride, pad):
    fil_h, fil_w = fil_size, fil_size
    y_h, y_w = y_size, y_size
    index = -1
    
    x_pad = np.pad(x, [(pad, pad), (pad, pad)], "constant")
    x_col = np.zeros((fil_h*fil_w, y_h*y_w))
    
    for h in range(fil_h):
        h2 = h + y_h*stride
        for w in range(fil_w):
            index += 1
            w2 = w + y_w*stride
            x_col[index,:] = x_pad[h:h2:stride,w:w2:stride].reshape(-1)
    
    return x_col

# In[12]
im2col(x,2,3,2,1)