交叉项是指两个变量联合解释,单独变量解释时会存在很明显的偏误,通过增加交叉项来降低该变量的偏误,以及防治单独变量错误回归时地错误解释。
考虑reg
y
a
和reg
y
a
ab
其中y是成绩
,a是听课时间,
b是不认真程度,第一个回归可以得到y和a应该正相关,第二个回归能得到y与a正相关,但与ab负相关。若只考虑第一个回归,那我们就错误地得出结论听课时间越长成绩越好,其实考虑第二个回归就能发现成绩不仅和时间有关还与认真度有关。
一般交叉项用于定量变量(数量级,多少个)和定性变量(表示程度或者性质)之间的组合,比如最简单的性别问题,就可以在原解释变量上乘以一个性别地虚拟变量。
模型中自变量ABC,调节变量DE,因变量F,假设A影响F,B影响F,C影响F,调节变量D分别调节ABC和F之间的关系,调节变量E分别调节ABC和F之间的关系,现在使用交互项通过分层回归检验调节效应