
データのグループ間の比較 【Rで実装】
記事の目的
データのグループ間の統計量を確認したり、プロットをRを使用して実装します。
目次
| 目次 | 概要 |
| グループ別の統計量 | dplyrを使用 |
| グループ別にプロット | ヒストグラム、箱ひげ図、バイオリンプロット |
グループ別の統計量
iris %>%
group_by(Species) %>%
summarise(合計=sum(Sepal.Length),
平均=mean(Sepal.Width),
標準偏差=sd(Petal.Length),
サンプルサイズ=n())

グループ別にプロット
- 同一のグラフにヒストグラム
iris %>% ggplot(aes(Sepal.Length, fill=Species)) + geom_histogram(binwidth = 0.1)

- 別々のグラフにヒストグラム
iris %>% ggplot(aes(Sepal.Length)) + geom_histogram(binwidth = 0.1) + facet_grid(~Species)

- 箱ひげ図
iris %>% ggplot(aes(Species, Sepal.Length)) + geom_boxplot()

- バイオリンプロット
iris %>% ggplot(aes(Species, Sepal.Length)) + geom_violin()
