SVM简介

SVM - Support Vector Machines, 支持向量机。是二分类模型。

线性可分SVM

输入空间：输入所有可能的取值的集合

特征向量：每个具体的输入

特征空间：所有特征向量存在的空间。特征空间可以是输入空间，也可以由输入空间映射得到。模型定义在特征空间上。

输出空间：输出所有可能的取值的集合

在特征空间找到一个分离超平面 \(wx+b=0\)，并且间隔最大。

PLA:误分类最小策略，求得分离超平面。解不唯一。线性可分SVM:间隔最大化，求得分离超平面。解唯一。

一个点距离分离超平面的远近|wx+b| 是分类预测的确信程度。例如将A分为0的确信度很高，而将C分为0的确信度较低
wx+b与y的符号一致，则分类正确
函数间隔：y(wx+b)，表示分类的正确性及确信度
超平面的函数间隔*：min{y(wx+b)}
几何间隔：规范化||w||=1，即为\(y(\frac{w}{||w||}\cdot x + \frac{b}{||w||})\)，使得间隔固定。（因为w和b成比例增加时，超平面不会改变，但函数间隔会变大）

一开始的目标是： -- 目标：求得一个x，使得margin最大 -- 条件： --- 每个点都被正确分类（b被塞入了w矩阵里） --- magin是最近的点的距离
从距离的理解入手，如图所示
w的理解 -- 灰色是分割平面 -- \(x'\)和\(x''\)是平面上的两个点，则它俩满足\(w^T X' = -b\)，\(w^T x'' = -b\) -- 两式相减，得到 \(w^T(x'' - x')=0\) -- 则w垂直于平面，即w是平面的法向量 -- 那么dist是向量\(x' x''\)在w上的投影