データのグループ間の比較 【Rで実装】

記事の目的

データのグループ間の統計量を確認したり、プロットをRを使用して実装します。

 

目次

目次 概要
グループ別の統計量 dplyrを使用
グループ別にプロット ヒストグラム、箱ひげ図、バイオリンプロット

 

グループ別の統計量

iris %>%
  group_by(Species) %>%
  summarise(合計=sum(Sepal.Length),
            平均=mean(Sepal.Width),
            標準偏差=sd(Petal.Length),
            サンプルサイズ=n())

 

グループ別にプロット

  • 同一のグラフにヒストグラム
iris %>%
  ggplot(aes(Sepal.Length, fill=Species)) +
  geom_histogram(binwidth = 0.1)

 

  • 別々のグラフにヒストグラム
iris %>%
  ggplot(aes(Sepal.Length)) +
  geom_histogram(binwidth = 0.1) +
  facet_grid(~Species)

 

  • 箱ひげ図
iris %>%
  ggplot(aes(Species, Sepal.Length)) +
  geom_boxplot()

 

  • バイオリンプロット
iris %>%
  ggplot(aes(Species, Sepal.Length)) +
  geom_violin()