【R言語の基礎#5】データの結合(bind系とjoin系)
記事の目的
R言語でのデータの結合方法について解説します。データをそのまま繋げるbind系と、被りのあるところを繋げるjoin系について解説します。
目次
1 使用するライブラリとデータの作成
1.1 使用するライブラリ
install.packages("dplyr") # 一度もインストールしていない場合 library(dplyr)
1.2 データの作成
dataA, dataB, dataCの3つのデータを作成します。
Id1 <- c(1,2,3) Height <- c(150,160,170) dataA <- data.frame(Id1, Height) Id2 <- c(1,3,5) Weight <- c(50,60,70) dataB <- data.frame(Id2, Weight) Id1 <- c(4,5,6) Height <- c(160,150,170) dataC <- data.frame(Id1, Height)
dataA | dataB | dataC |
2 bind系
2.1 rbind
dataAとdataCを縦に結合しました。
data1 <- rbind(dataA, dataC)
dataA | dataC | data1 |
2.2 cbind
dataAとdataBを横に結合しました。
data2 <- cbind(dataA, dataB)
dataA | dataB | data2 |
3 join系
3.1 left_join
dataAとdataBをidを指定して左を基準に結合
data3 <- left_join(dataA, dataB, by=c("Id1"="Id2"))
dataA | dataB | data3 |
3.1 right_join
dataAとdataBをidを指定して右を基準に結合
data4 <- right_join(dataA, dataB, by=c("Id1"="Id2"))
dataA | dataB | data4 |
3.1 full_join
dataAとdataBをidを指定して結合
data5 <- full_join(dataA, dataB, by=c("Id1"="Id2"))
dataA | dataB | data5 |