【R言語の基礎#5】データの結合(bind系とjoin系)

記事の目的

R言語でのデータの結合方法について解説します。データをそのまま繋げるbind系と、被りのあるところを繋げるjoin系について解説します。

 

目次

  1. 使用するライブラリとデータの作成
  2. bind系
  3. join系

 

1 使用するライブラリとデータの作成

1.1 使用するライブラリ

install.packages("dplyr") # 一度もインストールしていない場合
library(dplyr)

 

1.2 データの作成

dataA, dataB, dataCの3つのデータを作成します。

Id1 <- c(1,2,3)
Height <- c(150,160,170)
dataA <- data.frame(Id1, Height) 
Id2 <- c(1,3,5)
Weight <- c(50,60,70)
dataB <- data.frame(Id2, Weight) 
Id1 <- c(4,5,6)
Height <- c(160,150,170)
dataC <- data.frame(Id1, Height)
dataA dataB dataC

 

2 bind系

2.1 rbind

dataAとdataCを縦に結合しました。

data1 <- rbind(dataA, dataC)
dataA dataC data1

 

2.2 cbind

dataAとdataBを横に結合しました。

data2 <- cbind(dataA, dataB)
dataA dataB data2

 

3 join系

3.1 left_join

dataAとdataBをidを指定して左を基準に結合

data3 <- left_join(dataA, dataB, by=c("Id1"="Id2"))
dataA dataB data3

 

3.1 right_join

dataAとdataBをidを指定して右を基準に結合

data4 <- right_join(dataA, dataB, by=c("Id1"="Id2"))
dataA dataB data4

 

3.1 full_join

dataAとdataBをidを指定して結合

data5 <- full_join(dataA, dataB, by=c("Id1"="Id2"))
dataA dataB data5