【Rで多変量解析#9】数量化2類
記事の目的
数量化2類をRを使用して実装していきます。データの作成から実装するので、コピペで再現することが可能です。
目次
1 ライブラリ
library(dplyr) library(ggplot2) library(MASS)
2 データの作成
set.seed(10) N <- 30 講義 <- c(rep("講義A", N), rep("講義B", N), rep("講義C", N)) e1 <- rnorm(N, 0, 10) ; e2 <- rnorm(N, 0, 10) ; e3 <- rnorm(N, 0, 10) 合格 <- c("不合格", "合格") 合格 <- c(合格[rbinom(N,1,0.5)+1], 合格[rbinom(N,1,0.2)+1], 合格[rbinom(N,1,0.8)+1]) data <- data.frame(講義, 合格) data %>% sample_n(5)
3 データの可視化
table(data)
4 (データの変換)
data %>% mutate(講義B = ifelse(講義=="講義B", 1, 0)) %>% mutate(講義C = ifelse(講義=="講義C", 1, 0)) %>% sample_n(5)
5 数量化2類
lda(data=data, 合格~講義)