数学建模 -- 岭回归和lasso回归

来自清风的数学建模课程,主要是用于自己复习看,所以截图较多

标准化:减去均值)除以方差

古典回归模型要满足四个假定

线性假定

image.png

严格外生性

保证估计出来的回归系数无偏且一致

扰动项均值为0.并且和自变量不相关

无完全多重共线性

保证回归系数β可以被估计出来

球型扰动项

同方差 无自相关

岭回归

原理

岭回归对于多元线性回归的优点

对于 无完全多重共线性 放松 n<k 可以 样本个数小于指标个数

如何选择 喇嘛塔

  • 岭迹分析

  • VIF法(方差膨胀因子)

  • 最小化均方预测误差

lasso回归

建模lasso用的大于岭回归

stata进行laoos回归

// 导入数据,注意修改Excel文件的地址
import excel "C:\Users\hc_lzp\Desktop\数学建模视频录制\A01更新\岭回归和lasso回归\数据和拓展资料\棉花产量论文作业的数据.xlsx", sheet("data") firstrow
// 注意:这里自变量的量纲相同所以不用标准化,如果需要标准化,那么可以借助Matlab的zscore函数,或者直接使用SPSS(分析-描述统计-描述:在描述列表的方框左下角,看到“将标准化得分另存为变量(Z)之后点击打勾,然后确定。)
// Stata中也有相应的标准化变量的命令,不过一次只能标准化一个变量,例如: egen Y = std(单产)   这个代码就表示将单产标准化,得到的变量记为Y
cvlasso 单产 种子费 化肥费 农药费 机械费 灌溉费, lopt seed(520)

打星星的是喇嘛塔最小值

什么时候使用lasso回归?