【Rで多変量解析#1】単回帰分析
記事の目的
単回帰分析をRを使用して実装していきます。データの作成から実装するので、コピペで再現することが可能です。
目次
1 ライブラリ
library(dplyr) library(ggplot2)
2 データの作成
2.1 コード
set.seed(10) 年齢 <- rnorm(100, 40, 20) e <- rnorm(100, 0, 50) 年収 <- 5*年齢 + 300 + e data <-data.frame(年齢, 年収) %>% filter(18<年齢&年齢<60) %>% mutate(年齢=round(年齢), 年収=round(年収)) data %>% head()
2.2 結果
3 データの可視化
3.1 コード
x <- seq(20,60,1) ggplot()+ geom_point(aes(data$年齢, data$年収))+ theme_classic(base_family = "HiraKakuPro-W3") + theme(text=element_text(size=30)) + labs(x="年齢", y="年収", title="単回帰分析")
3.2 結果
4 単回帰分析
4.1 コード
model <- lm(data=data, 年収~年齢) summary(model)
4.2 結果
5 結果の可視化
5.1 コード
x <- seq(20,60,1) ggplot()+ geom_point(aes(data$年齢, data$年収))+ theme_classic(base_family = "HiraKakuPro-W3") + theme(text=element_text(size=30)) + geom_line(aes(x, model$coefficients[2]*x+model$coefficients[1]), col="blue") + labs(x="年齢", y="年収", title="単回帰分析")
5.2 結果