18-预测房价竞赛总结
本节目录
1.方法总结
下面提供了排行榜前几使用的方法介绍链接
第二和第七:autogluon
第三:h2o
第四:随机森林
分类标签归档:深度学习
下面提供了排行榜前几使用的方法介绍链接
第二和第七:autogluon
第三:h2o
第四:随机森林
权重衰退是最常见的一种处理过拟合的方法,是最广泛使用的正则化技术之一。
复习:控制模型容量
- 使用更少参数
- 控制每个参数(取值/可选择的值)范围较小
其中权重衰退属于第二种方法。
我们的优化目标仍然是),只是额外对
添加一个限制条件
,即权重的各项平方和小于一个特定的常数
。那么设定一个较小的
就会使得
中每个元素的值都不会太大。
通常不会限制偏移b,理论上讲b表示整个数据在零点上的偏移,
房价预测例子
线性模型
输入:$x=[x_1,x_2,...,x_n]^T$
线性模型需要确定一个n维权重和一个标量偏差$\omega=[\omega_1,\omega_2,...,\omega_n]^T,b$
输出 :$y=\omega_1x_1+\omega_2x_2+...+\omega_nx_n+b$,
向量版本的是 $y=<\omega,x>+b$
线性模型可以看作是单层神经网
#### 1.2 拓展到向量
需要注意维数的变化
下图三种情况分别对应:
- y为标量,x为向量
- y为标量,x为矩阵
- y、x为矩阵
这里应该是用分子布局,所以是X转置
X是mxn的矩阵,w为n维向量,y为m维向量; z对