如何评估和应用监督模型
在生产系统中使用监督模型进行预测之前,评估监督模型的质量很重要。用户可以选择针对问题的最佳模型,并用它来预测应用数据集的目标值。
为了测试监督模型,将历史数据分成两个数据集,一个用于构造模型,另一个用于测试模型。测试数据集实例通常不用于构造模型,目的是为了真正评估模型的预测正确性。JDM为分类模型支持四种流行的测试度量: 预测准确率、模糊矩阵、受试者工作特征(ROC)和提升率。这些度量的计算方式是通过比较预测目标值和实际目标值。这里探讨在ABCBank客户流失问题这一环境下的这些测试度量。
评估分类模型的质量
在客户流失问题中,假定测试数据集有1000个实例,分类模型正确预测了910个实例、错误预测了90个实例。那么模型预测该数据集的准确率为910/1000 = 0.91,即91%。
假设在910个正确的预测中,750个客户是非流失客户,剩余160个是流失客户。在90个错误的预测中,60个被预测为流失客户,而实际上是非流失客户;30个被预测为非流失客户,而实际上是流失客户。为此,我们使用名为模糊矩阵的方法。模糊矩阵是一张二维的N×N表,表明了分类模型对特定测试数据进行的正确预测和不正确预测的数量,其中N代表目标属性值的数量。之所以被称为模糊矩阵,因为它指出了模型在何处变得模糊,即做出不正确的预测。
虽然在本例中模糊矩阵度量的是目标值的错误分类,但错误否定的成本是错误肯定的三倍。为了从业务角度评估模型质量,除了准确率外,我们还需要度量成本。如果指定了成本矩阵,考虑成本值来度量性能、选择成本值最小的模型很重要。
受试者工作特征(ROC)是比较分类模型质量的另一个方法。ROC图把错误肯定率放在X轴上、把真肯定率放在Y轴上,如图1所示。其中,错误肯定率是错误肯定数量与实际否定总数之比。同样,真肯定率是真肯定数量与实际肯定总数之比。
想绘制ROC图,测试任务就要确定在不同概率阈值下,错误肯定和真肯定的比率。超过概率阈值预测的肯定目标值的概率就被认为是肯定预测。不同的概率阈值导致出现不同的错误肯定率和真肯定率。如图1(a)所示。
图1(b)显示了两个分类模型在不同概率阈值下绘制的ROC曲线。如果错误肯定率不同,这些模型的性能也不同。ROC曲线下方面积越大,模型性能一般越高。
提升率和累积增益也是评估分类模型效果的常用度量。提升率是使用分类模型获得的结果与使用随机选择获得的结果之比。累积增益是由模型通过数据分位数(quantile)决定的肯定响应比例。实例通常分成10个或者100个分位数,可以根据这些分位数得出提升率和累积增益,如表1所示。提升图和累积增益图往往用做评估性能模型的直观教具。了解累积提升和累积增益的计算方式有助于了解累积提升和累积增益图,如图2所示。
获得预测结果
使用测试数据评估了模型性能后,用户可以选择针对问题的最佳模型,并用它来预测应用数据集的目标值。有些算法可能在最终模型中使用输入属性的一个子集。这个属性子集称为模型特征(model signature),它可以从模型中获取,确定应用模型需要哪些属性。
本文利用简单的决策树模型来演示模型应用操作。该模型有三个输入属性:年龄、资本收益和平均储蓄余额,如上文B23版表2所示。模型只用了其中的两个属性:年龄和平均储蓄余额,如图3所示。这两个属性构成了模型特征。因而,要使用这个模型,该模型的应用数据集只需要包含有年龄和平均储蓄余额两个属性值的实例。要了解应用过程,不妨考虑有两个客户实例:客户Jones和Smith的应用数据集,如表2所示。
分类应用操作可以使用各种内容来生成预测结果,譬如预测类别、概率、成本。在JDM中,可通过各种形式显示应用预测结果,譬如顶层预测细节、顶节点或底节点预测等。预测结果的选择取决于问题需求以及用户想看到的信息类型。在本例中,我们生成了顶层预测值及对应的概率和成本,以确认流失客户。
即使将模型应用到数据集上很常见,但如果客户属性发生变化,预测和概率可能会随之变化。譬如说,如果客户打电话给银行要求把大笔资金从储蓄账户转到另一家银行,呼叫中心的应用系统就会显示预先计算的预测,表明该客户可能会流失。这基于客户的前一个账户余额。如果转账,这可能会改变模型对该客户的预测。因此,根据最新数据实时重新评估客户很有用。这可以使用JDM的单记录应用功能就可以实现,旨在提供实时响应机制。 (ccw)
- 1JMP和Minitab的比较
- 2Windows Vista服务安全强化的十大策略
- 3解读版本控制工具
- 4静态数据加密有效地防止信息泄漏
- 5十大战略性技术问鼎2008
- 6加密电子邮件
- 7泛普OA软件中资产送修的操作页面是怎样的?
- 8新光增持中百集团成第一大单一股东
- 9两大用户的VPN部署经验
- 10怎样用iReport制作Web报表
- 11中国进入汽车新召回时代 或是三包出台前奏
- 122013年南京家装市场刚需装修仍占主导地位
- 13ITIL与6sigma的关联与应用分析
- 14网友实践:一个木马病毒的查杀过程
- 15实现网络接入与内外用户安全的均衡
- 16国务院办公厅关于2013年部分节假日安排的通知
- 17专家指导 深入剖析服务器虚拟化成本
- 18安倍称担忧其任首相后中日爆发战争不现实
- 19客户做自己OA系统的主人始终是泛普软件的最终目标
- 20历数云计算为安全所带来的七大利好
- 21韩美暂时评价认为朝鲜火箭发射成功
- 22掌握家装洽谈五大技巧-2
- 23软件开发技术的突破性进展
- 24王岐山要求美国停止对中国企业政治背景审查
- 252008年中国.NET技术应用趋势分析
- 26安倍外交开场混乱 访美计划被迫推迟首访改东南亚三国
- 27SOA的十大技术理论体系
- 28企业信息化大讲堂之路由器基础知识
- 29HTTP过滤将对安全市场产生深远影响
- 30多种数据复制技术简析