回归方程拟合度评价

  • SSTSST:总偏差平方和:因变量实际值与因变量平均值的差的平方和,反应因变量取值的总体波动情况
  • SSRSSR:回归平方和:因变量回归值与其均值的差的平方和,反映了因变量偏差值由X的关系所引起的偏差,可以由回归曲线进行解释。
  • SSESSE:残差平方和:因变量实际值与回归值的差的平方和,反映了因变量偏差值由X的关系以外的其他关系所引起的偏差,不可以由回归曲线进行解释。

SST=SSR+SSESST=SSR+SSE

定义:

R2=SSR/SSTR2=SSR/SST

其取值范围为010\sim 1越接近于1说明拟合效果越好。

线性回归实战

sklearn通过linear_model模块(广义线性模型)来进行线性回归预测,其模型原理为:

y(w,x)=w0+w1x1+w2x2++wpxpy(w,x)=w_0+w_1x_1+w_2x_2+\cdots+w_px_p

数据结构

为了更好地刻画参数,有必要将工艺数据参数化设计成一个数组。