广义线性回归
广义线性模型扩展了线性模型的框架,它包含了非正态因变量的分析,但可以将一些符合特定特征的模型通过一定的转换,将其转变为线性模型的形式,这些模型就被囊括进了广义线性模型之中。。包括Logistic回归(因变量为二值型),泊松回归(因变量为计数型)
Logistic回归
当通过一系列连续型和/或类别型预测变量来预测二值型结果变量时,常使用Logistic回归。R语言中常使用glm()函数来拟合Logistic回归为了理解逻辑回归我们先理解线性回归
为了理解逻辑回归我们先理解线性回归
drunkdoor = read_csv("<https://uoepsy.github.io/data/drunkdoor.csv>")
drunkdoor %>% glimpse()
mod_linear = lm(notice ~ age, data = drunkdoor)
summary(mod_linear)
drunkdoor %>%
ggplot(aes(age, notice))+
geom_point()+
geom_smooth(method = "lm")+
ylim(c(-0.5,1.5))

此时y值只能取到0或1,因此,我们给加上限制条件,$\hat{y}=\left\{\begin{array}{l}1, f(x)>0.5 \\0, f(x)<0.5\end{array}\right.$
sigmond函数
统计学家发现,sigmond函数和上述函数具有很高的相似性,且sigmoid有个平滑的过渡因此,使用sigmood函数来作为logistic回归算法的拟合函数
$$ f(z)= \frac{1}{1+e^{-z}} $$


因此对于一元逻辑回归来说
$$ P(Y=1)= \frac{1}{1+e^{-(\beta {0}+\beta{1}{x_1})}} $$
或者
$$ \ln(\frac{P(Y=1)}{1-P(Y=1)})= \beta _{0}+ \beta {1}x{1} $$
其中$P(Y=1)$为y为情况1时的概率,此时引入odds(比率、发生比),logodds(对数比率,对数发生比),发生比反应事件的几率如何随着x单位的增加而变化