【Rで多変量解析#1】単回帰分析

記事の目的

単回帰分析をRを使用して実装していきます。データの作成から実装するので、コピペで再現することが可能です。

 

目次

  1. ライブラリ
  2. データの作成
  3. データの可視化
  4. 単回帰分析
  5. 結果の可視化

 

1 ライブラリ

library(dplyr)
library(ggplot2)

 

2 データの作成

2.1 コード

set.seed(10)
年齢 <- rnorm(100, 40, 20) 
e <- rnorm(100, 0, 50) 
年収 <- 5*年齢 + 300 + e
data <-data.frame(年齢, 年収) %>%
  filter(18<年齢&年齢<60) %>%
  mutate(年齢=round(年齢), 年収=round(年収))
data %>% head()

 

2.2 結果

 

3 データの可視化

3.1 コード

x <- seq(20,60,1)
ggplot()+
  geom_point(aes(data$年齢, data$年収))+
  theme_classic(base_family = "HiraKakuPro-W3") +
  theme(text=element_text(size=30)) +
  labs(x="年齢", y="年収", title="単回帰分析")

 

3.2 結果

 

4 単回帰分析

4.1 コード

model <- lm(data=data, 年収~年齢)
summary(model)

 

4.2 結果

 

5 結果の可視化

5.1 コード

x <- seq(20,60,1)
ggplot()+
  geom_point(aes(data$年齢, data$年収))+
  theme_classic(base_family = "HiraKakuPro-W3") +
  theme(text=element_text(size=30)) +
  geom_line(aes(x, model$coefficients[2]*x+model$coefficients[1]), col="blue") +
  labs(x="年齢", y="年収", title="単回帰分析")

 

5.2 結果