数学建模 matlab MATLAB机器学习 分类方法 支持向量机分类 乳腺癌的诊断
一、理论基础1.支持向量分类机的基本原理1.1线性可分支支持向量分类机1.2 线性支持向量分类机1.3可分支支持向量分类机1.4C-支持向量分类机二、案列1. 支持向量机的分类模型支持向量机(Sport Vector Machine ,以下简称 SVM)是一种基于统计学习理论的 模式识别方法。在模式识别等领域获得了广泛的应用。其主要思想是这样:找到一个超 平面,使得它能够尽可能多的将两类数据点正确
一、理论基础
1.支持向量分类机的基本原理
1.1线性可分支支持向量分类机
1.2 线性支持向量分类机
1.3可分支支持向量分类机
1.4C-支持向量分类机
二、案列
1. 支持向量机的分类模型
支持向量机(Sport Vector Machine ,以下简称 SVM)是一种基于统计学习理论的 模式识别方法。在模式识别等领域获得了广泛的应用。其主要思想是这样:找到一个超 平面,使得它能够尽可能多的将两类数据点正确地分开,同时使分开的两类数据点距离 分类面远,如图 。
已知观测样本为
将模型2换成一般的核函数K(x,y),可得一般的模型:
模型3
应用支持向量机时,可以按照线性可分、线性不可分、非线性可分、非线性不可分的顺序求解。
2.乳腺癌的诊断
乳腺肿瘤通过穿刺采样进行分析可以确定其为良性的或为恶性的。医学研究发现 乳腺肿瘤病灶组织的细胞核显微图像的 10 个量化特征:细胞核直径、质地、周长、面 积、光滑度、紧密度、凹陷度、凹陷点数、对称度、断裂度与该肿瘤的性质有密切的关 系。现试图根据已获得的实验数据建立起一种诊断乳腺肿瘤是良性还是恶性的方法。数 据来自已确诊的 500 个病例,每个病例的一组数据包括采样组织中各细胞核的这 10 个 特征量的平均值、标准差和坏值共 30 个数据,并将这种方法用于另外 69 名已做穿刺 采样分析的患者。 这个问题实际上属于模式识别问题。什么是模式呢?广义地说,在自然界中可以 观察的事物,如果我们能够区别它们是否相同或是否相似,都可以称之为模式。人们为 了掌握客观事物,按事物相似的程度组成类别。模式识别的作用和目的就在于面对某一 具体事物时将其正确地归入某一类别。 模式识别的方法很多,如数理统计方法、聚类分析方法等。
代码:
根据模型一写的!
运行结果:
3.例题总结:
1.读取整个文件,并优化数据。删除多余无用的数据,并将所有数据数字化。
2.读取已知样本点,然后用mapstd函数进行标准化处理。
3.读取待分类样本点,然后用mapstd函数进行标准化处理。
4.用svmtrain函数和svmclassify函数对已知的样本点进行向量分类。
5.最后,用svmclassify函数对待分类样本点进行向量分类。
更多推荐
所有评论(0)