当前位置:工程项目OA系统 > 建筑OA系统 > 建筑工程项目管理软件
支持向量机在数据挖掘中的应用研究
摘 要:支持向量机(Support Vector Machine, SVM)是数据挖掘和机器 学习 中的一个很有效的工具。结合支持向量机在数据挖掘和机器学习中的 应用 , 介绍了支持向量机的基本原理, 发展 方向及其 研究 热点。
关键词:支持向量机; 数据挖掘; 机器学习 1 SVM的提出和基本思想 支持向量机是Vapnik等人提出的,在解决小样本、非线性及高维模式识别 问题 中表现出许多特有的优势,已应用于手写体识别、三维目标识别、人脸识别、文本图像分类等实际问题中,性能优于已有的学习 方法 ,表现出良好的学习能力。它是从线性可分情况下的线性分类面发展而来的,接着利用核函数很好的解决了非线性可分情况。 2 支持向量机的几个发展 (1)模糊支持向量机,引入样本对类别的隶属度函数,这样每个样本对于类别的 影响 是不同的,这种 理论 的应用提高了SVM的抗噪声的能力,尤其适合在未能完全揭示输入样本特性的情况下。 (2)最小二乘支持向量机。这种方法是在1999年提出,经过这几年的发展,已经应用要很多相关的领域。研究的问题已经推广到:对于大规模数据集的处理;处理数据的鲁棒性;参数调节和选择问题;训练和仿真。 (3)加权支持向量机(有偏样本的加权,有偏风险加权)。 (4)主动学习的支持向量机。主动学习在学习过程中可以根据学习进程,选择最有利于分类器性能的样本来进一步训练分类器,特能有效地减少评价样本的数量。 (5)粗糙集与支持向量机的结合。首先利用粗糙集理论对数据的属性进行约简,能在某种程度上减少支持向量机求解 计算 量。 (6)基于决策树的支持向量机。对于多类问题,采用二岔树将药分类的样本集构造出一系列的两类问题,每个两类构造一个SVM。 (7)分级聚类的支持向量机。基于分级聚类和决策树思想构建多类svm,使用分级聚类的方法,可以先把n-1个距离较近的类别结合起来,暂时看作一类,把剩下的一类作为单独的一类,用svm分类,分类后的下一步不再考虑这单独的一类,而只研究所合并的n-1类,再依次下去。 (8)算法上的提高。Vapnik在1995年提出了一种称为“chunking”的块算法,即如果删除矩阵中对应Lagrange乘数为0的行和列,将不会影响最终结果。Osuna提出了一种分解算法,应用于人脸识别领域。Joachims在1998年将Osuna提出的分解策略推广到解决大型SVM学习的算法。Platt于1998年提出了序贯最小优化每次的工作集中只有2个样本。 (9)核函数的构造和参数的选择理论研究。基于各个不同的应用领域,可以构造不同的核函数,能够或多或少的引入领域知识。现在核函数广泛应用的类型有:多项式逼近、贝叶斯分类器、径向机函数、多层感知器。参数的选择现在利用交叉验证的方法来确认。 (10)支持向量机从两类问题向多类问题的推广。Weston在1998年提出的多类算法为代表。在经典svm理论的基础上,直接在目标函数上进行改进,重新构造多值分类模型,建立k分类支持向量机。通过sv方法对新模型的目标函数进行优化,实现多值分类。 一对多(one-against-rest)——Vapnik提出的,k类——k个分类器,第m个分类器将第m类与其余的类分开,也就是说将第m类重新标号为1,其他类标号为-1。完成这个过程需要计算k个二次规划,根据标号将每个样本分开,最后输出的是两类分类器输出为最大的那一类。不足:容易产生属于多类别的点(多个1)和没有被分类的点(标号均为-1)——不对,训练样本数据大,训练困难,推广误差无界。 层(数分类方法),是对一对一方法的改进,将k个分类合并为两个大类,每个大类里面再分成两个子类,如此下去,直到最基本的k个分类,这样形成不同的层次,每个层次都用svm来进行分类——1对r-1法,构建k-1个分类器,不存在拒绝分类区。 3 主要研究热点 从上面的发展中,我们可以 总结 出, 目前 支持向量机有着几方面的研究热点:核函数的构造和参数的选择;支持向量机从两类问题向多类问题的推广;更多的应用领域的推广;与目前其它机器学习方法的融合;与数据预处理(样本的重要度、属性的重要度、特征选择等)方法的结合。 参考 文献 [1]?张学工.统计 学习 理论 的本质[M].北京:清华大学出版社,2000. [2]?NelloCristianini,JohnShawe-Taylor.支持向量机导论[M].北京: 电子 工业 出版社,2004.- 1项目管理工具
- 2建筑工程项目管理软件
- 3工程项目管理软件系统
- 4开源项目管理软件
- 5项目管理软件下载
- 6重庆建筑施工项目管理系统开发
- 7工程项目管理软件下载
- 8多项目管理
- 9项目管理系统
- 10好用的项目管理
- 11企业项目管理排名
- 12项目管理软件
- 1关于举办以房抵债合同效力及工程收款风险控制实务高级研修班的预备通知
- 22015招标师专业实务第二章命题点:公开招标和邀请招标的区别
- 3砖筒壁配筋范围和最小配筋
- 4一级建造师复习资料:流水施工的基本组织形式
- 5近九成工程签署质量终身责任承诺书
- 6建筑施工程序歌谣
- 72015年监理工程师《投资控制》每日一练(5.23)
- 8造价工程师考试基础理论与相关法律法规辅导(五)
- 9防洪二期工程C2标段工程施工组织设计方案
- 10不可抗力费用索赔问题
- 11插型钢高压旋喷桩基坑支护方法
- 12四川首个建筑工业化基地投产 未来重点打造100%预制化建筑
- 13恩施州某医院外科大楼工程钢筋施工方案
- 14沪昆客专贵州段又一座特大桥——高峰特大桥顺利架通
- 15中国第一根4米大直径桥梁钻孔桩灌注成功
- 16水泥价现20年未见上涨行情 山西已断货
- 172015二级建造师《施工管理》重点(10)
- 182015年造价工程师《计价与控制》资料:财务基础数据
- 19梁中配有计算需要的纵向受压钢筋时箍筋配置有哪些?
- 202015年监理工程师《进度控制》每日一练(10.23)
- 21北京某公寓式酒店钢筋工程施工方案(鲁班奖)
- 22钢筋混凝土框架结构施工工艺
- 23室外大跨度电缆桥架如何计算
- 24安顺混凝土搅拌机厂家哪家好
- 25高层钢结构建筑的工程监理特点分析(二)
- 26建筑工程抹水泥砂浆施工工艺
- 27自然人的3种民事行为能力:完全民事行为能力
- 28二级建造师实务复习要点:压浆顺序
- 29[北京]办公楼工程二次结构施工工艺
- 30【5月27日预测】天津建材价格继续维稳
成都公司:成都市成华区建设南路160号1层9号
重庆公司:重庆市江北区红旗河沟华创商务大厦18楼