很多东西看了就忘。一定要好好做笔记。
本节主要记录《机器学习基石》的常见符号。
基础符号
输入: $ x X $ 输出: $y Y $ 目标函数: $f:XY $ (理想中的,实际得不到) 假设函数:$g:XY $ ,又称为hypothesis
(学习到的g,希望跟f越像越好) $g H $ 假设函数集合:$H = \{h_k\} $ hypothesis set
训练集:\(D=\\{(x_1,y_1),...,(x_N,y_N)\\}\) 机器学习演算法:\(A\)
机器学习流程
- 从数据集D出发
- 通过演算法A,来计算出一个g,使得g很接近f
误差E
不知道为什么公式显示不出来,只好手动展图了 输入误差:
\[E_{in}(h)=\frac{1}{N} \sum_{n=1}^N(h(x_n)-y_n)^2\]
- 样本(训练集)中出现的错误率
输出误差:
\[E_{out}(h)=\mathcal{E}_{(x,y)\text~P}(w^Tx-y)^2\]
- 总体(测试集+训练集)中出现的错误率