13-丢弃法
本节目录
1.丢弃法动机、实现及原则
1.1动机
- 一个好的模型需要对输入数据的扰动鲁棒(健壮性)
1.2如何实现模型的这一能力
- 使用有噪音的数据。
- 丢弃法:在层之间加入噪音。
1.3加入噪音的原则
- 例如模型的功能是识别猫猫,加入噪音可以是输入模糊的猫猫图片,但尽量不要是狗狗的图片。
2.丢弃法内容
- 丢
分类标签归档:python
权重衰退是最常见的一种处理过拟合的方法,是最广泛使用的正则化技术之一。
复习:控制模型容量
- 使用更少参数
- 控制每个参数(取值/可选择的值)范围较小
其中权重衰退属于第二种方法。
我们的优化目标仍然是),只是额外对
添加一个限制条件
,即权重的各项平方和小于一个特定的常数
。那么设定一个较小的
就会使得
中每个元素的值都不会太大。
通常不会限制偏移b,理论上讲b表示整个数据在零点上的偏移,
房价预测例子
线性模型
输入:$x=[x_1,x_2,...,x_n]^T$
线性模型需要确定一个n维权重和一个标量偏差$\omega=[\omega_1,\omega_2,...,\omega_n]^T,b$
输出 :$y=\omega_1x_1+\omega_2x_2+...+\omega_nx_n+b$,
向量版本的是 $y=<\omega,x>+b$
线性模型可以看作是单层神经网
#### 1.2 拓展到向量
需要注意维数的变化
下图三种情况分别对应:
- y为标量,x为向量
- y为标量,x为矩阵
- y、x为矩阵
这里应该是用分子布局,所以是X转置
X是mxn的矩阵,w为n维向量,y为m维向量; z对