支持向量机(SVM)是一种用于分类和回归分析的监督学习模型。其基本原理是通过在高维空间中寻找一个超平面,将数据点划分成不同的类别。这个超平面被选择为化两个类别之间的间隔,从而提高分类的准确性。
基本原理 线性可分的情况:在二维或三维空间中,SVM寻找一个线性超平面(如直线或平面)来分隔不同类别的数据点。目标是找到一个超平面,使得类别之间的间隔化。
间隔化:SVM试图找到距离近的数据点(支持向量)到超平面的距离的超平面。这些支持向量是决定超平面位置的关键点。
非线性情况:对于线性不可分的数据,SVM使用核函数(如径向基函数)将数据映射到高维空间,在高维空间中数据可能线性可分。然后在高维空间中应用相同的分类方法。
优化目标:SVM通过求解一个优化问题来确定超平面。优化目标是化间隔,并通过引入松弛变量来处理分类错误。