李宏毅机器学习课程笔记-3.梯度下降精讲
梯度下降伪代码梯度下降可以优化损失函数的值,使其尽量小,即可找到最好(在数据集上拟合效果最好)的模型参数。
现在假设模型$f$中只有一个参数$w$,则损失函数为$L(f)=L(w)$,梯度下降算法如下(若模型有多个参数,按相同方法更新各参数)
初始化参数
随机选取一个$w^0$($w^0$并不一
...
快给我氧气!