一些概念

广义线性回归

广义线性模型扩展了线性模型的框架,它包含了非正态因变量的分析,但可以将一些符合特定特征的模型通过一定的转换,将其转变为线性模型的形式,这些模型就被囊括进了广义线性模型之中。。包括Logistic回归(因变量为二值型),泊松回归(因变量为计数型)

Logistic回归

当通过一系列连续型和/或类别型预测变量来预测二值型结果变量时,常使用Logistic回归。R语言中常使用glm()函数来拟合Logistic回归为了理解逻辑回归我们先理解线性回归

为了理解逻辑回归我们先理解线性回归

drunkdoor = read_csv("<https://uoepsy.github.io/data/drunkdoor.csv>")

drunkdoor %>% glimpse()

mod_linear = lm(notice ~ age, data = drunkdoor)
summary(mod_linear)

drunkdoor %>% 
  ggplot(aes(age, notice))+
  geom_point()+
  geom_smooth(method = "lm")+
  ylim(c(-0.5,1.5))

Untitled

此时y值只能取到0或1,因此,我们给加上限制条件,$\hat{y}=\left\{\begin{array}{l}1, f(x)>0.5 \\0, f(x)<0.5\end{array}\right.$

sigmond函数

统计学家发现,sigmond函数和上述函数具有很高的相似性,且sigmoid有个平滑的过渡因此,使用sigmood函数来作为logistic回归算法的拟合函数

$$ f(z)= \frac{1}{1+e^{-z}} $$

Untitled

Untitled

因此对于一元逻辑回归来说

$$ P(Y=1)= \frac{1}{1+e^{-(\beta {0}+\beta{1}{x_1})}} $$

或者

$$ \ln(\frac{P(Y=1)}{1-P(Y=1)})= \beta _{0}+ \beta {1}x{1} $$

其中$P(Y=1)$为y为情况1时的概率,此时引入odds(比率、发生比),logodds(对数比率,对数发生比),发生比反应事件的几率如何随着x单位的增加而变化