データのグループ間の比較 【Rで実装】
記事の目的
データのグループ間の統計量を確認したり、プロットをRを使用して実装します。
目次
目次 | 概要 |
グループ別の統計量 | dplyrを使用 |
グループ別にプロット | ヒストグラム、箱ひげ図、バイオリンプロット |
グループ別の統計量
iris %>% group_by(Species) %>% summarise(合計=sum(Sepal.Length), 平均=mean(Sepal.Width), 標準偏差=sd(Petal.Length), サンプルサイズ=n())
グループ別にプロット
- 同一のグラフにヒストグラム
iris %>% ggplot(aes(Sepal.Length, fill=Species)) + geom_histogram(binwidth = 0.1)
- 別々のグラフにヒストグラム
iris %>% ggplot(aes(Sepal.Length)) + geom_histogram(binwidth = 0.1) + facet_grid(~Species)
- 箱ひげ図
iris %>% ggplot(aes(Species, Sepal.Length)) + geom_boxplot()
- バイオリンプロット
iris %>% ggplot(aes(Species, Sepal.Length)) + geom_violin()