首先介绍线性核函数的概念:就是没有核函数,用θ0+θ1*X1+θ2*X2+...θn*Xn进行分类。

假设有数据有n个特征,m条数据:


则当n很大,m很小的时候,用线性核函数。

n很小,m很大的时候,用高斯核函数。

选择高斯核函数的时候需要调整参数δ,如果δ的平方很大,那么你就有可能得到一个较大的误差、较低方差的分类器。

但是如果σ 的平方很小那么你就会有较大的方差,较低误差的分类器。
 

正常情况下就使用以上两种核函数,另外还有几个核函数:


多项式核函数,公式如上图所示。以及字符串核函数等等,用以比较两个字符串之间的相似度。但这些都使用很少。


关于何时使用logistic regression或是svm:


当n远大于m时,用logistic或者svm线性核函数,因为此时数据不足没法很好拟合。

当m数量不多也不少,n不多的时候,用高斯核函数,此时拟合得可以很好。

当m很大的,n较小的时候,用logistic或者svm线性核函数,因为此时用高斯核函数的话,计算机的计算速度会很慢。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐