基于数据驱动的企业决策系统应用分析
引 言
随着计算机管理信息系统(Management Information System,简称MIS)的飞速发展和广泛应用,企业生产经营的自动化水平不断提高,它把人们从繁琐的事务处理中解脱出来,由原来的人工处理变成了计算机的科学管理,大大提高了工作效率。但高效率并不完全等同于高效益,企业业务系统运行所产生的大量原始数据是企业生产经营活动的真实记录,但由于缺乏集中存储和管理,这些数据不能为本企业加以利用,不能进行有效的统计、分析及评估,无法将这些数据转换成企业有用的信息、为企业战略决策提供参考和支持,也就无法像预期那样带来巨大的社会经济效益。企业海量业务数据利用率低下正日益成为企业信息化建设过程中的一块短板,设计开发基于数据驱动的企业决策支持系统(Decision Support System,简称DSS)是合理解决这一问题,提升企业综合竞争力的最佳对策。
基于数据驱动的企业决策支持系统
在企业自动化控制中,决策支持系统与管理信息系统是计算机技术应用于管理活动的两个不同发展阶段,MIS主要完成例行的日常信息处理任务,而DSSul是在传统的MIS基础上发展起来的一门交叉科学,是计算机技术、运筹学理论和管理科学相结合的交互式系统,用以帮助决策者使用数据和模型去解决结构化较差的问题。
基于数据驱动的决策支持系统是DSS的一种,强调运用数据仓库(Data Warehousing)、联机分析处理(Online Analytical Processing,OLAP)、数据挖掘(Data Mining)等技术进行大规模历史数据的采集、整理、分析、挖掘、比对、预测与展示,归纳出业务活动的规律性及其发展趋势,以支持决策制定过程。具体的,该系统应该能够基于数据驱动对各部门业务系统中的原始资料进行整合加工、提炼浓缩和格式转换,形成标准的格式化数据存储于集中的数据仓库中,为决策者提供决策所需的数据、信息和背景资料,帮助明确决策目标和进行问题的识别,提供各种备选方案,并对各种方案进行评价和优选,为正确决策提供有益帮助。
体系结构
位于最底层的是企业各部门运行的各类业务管理信息系统,包括生产管理系统、销售管理系统、库存管理系统、财务管理系统、人事管理系统、物流管理系统等。当前企业信息化建设主要还停留在这一层面,各管理信息系统在促进管理、提高效率的同时也能在所属部门对预测、决策提供一定的支持。但不同部门、业务、系统、后台的差异直接影响了各部门数据的综合利用,无法发挥整体效应,须加以整合。第二层的数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。接下来是数据挖掘和在线分析处理层面负责从数据仓库中挖掘有用的知识,其知识的形式有产生式规则、决策树、数据集与公式等。最终的数据展示层面包括后台报表引擎和前台报表查询,主要面向用户并负责向用户提供各种预定义查询、动态查询、OLAP查询、智能查询和各类关系数据表格、复杂表格、OLAP表格、报告、综合报表等,用易于理解的点线图、直方图、饼图、网状图、交互式可视化、动态模拟、计算机动画技术为决策分析人员展现复杂数据及其相互关系。
数据仓库的构建
数据仓库的构建需要通过ETL(Extract-Transform-Load)过程实现。ETL即数据的抽取、转换和装载,目的是将分散、零乱、标准不统一的业务系统的数据经过抽取、清洗转换整合到一起,加载到数据仓库,为分析决策提供依据。这一步骤完成之后,对库中数据的数据挖掘、分析处理才可以进行。
数据抽取是构建数据仓库的第一步,在实施之前需对数据源作详细地分析调研。了解一个企业由哪些部门组成,各部门运行哪些业务管理信息系统,各自后台数据库管理服务器是什么?是否存在未实施信息化的部门和手工数据,有多少数据量等等。对于手工录入的数据,如文本文件和EXCEL文件。一般先通过数据库导入工具将这些数据导入到指定的数据库,然后数据仓库从指定的数据库抽取。对于已经运行业务系统且后台数据库与数据仓库一致的情况,一般可利用数据库链接功能,在数据仓库服务器和数据库服务器之间建立链接关系通过查询语句直接访问数据源;如果不一致,一般情况下也可以通过ODBC的方式建立数据库链接。有时候为了安全是不允许数据库方式直接链接的,这种情况只能通过数据抽取软件将源数据导出成文本文件或是EXCEL文件,然后再转入数据仓库中。或者直接通过程序接口来完成。
抽取之后进行数据转换,同时往往伴随着数据的清洗和整合。清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。数据清洗之前必须先根据预定义规则进行检测,及时发现不符合要求的数据。对于不完整的数据进行补全,对于错误的数据进行修正,对于重复的数据确认后删除,以确保数据质量。数据转换的任务主要是进行不一致的数据转换、数据粒度的转换和一些商务规则的计算。不一致数据转换过程将不同业务系统的相同类型的数据统一整合,在此基础上分析、比较才能够进行。统一整合有两种途径,一种是以某一个系统编码为标准,来自其他系统的数据编码经过统一的规则转换为标准编码;另一种是单独建立一套标准编码体系,定义各业务系统编码与标准编码的对应关系,然后根据对应关系转换。数据粒度的转换是将业务系统数据按照数据仓库粒度进行聚合,通常是为了降低数据仓库存储量,提高数据挖掘效率。通过商务规则的计算可以预先将需要经过复杂运算的结果计算好了之后存储在数据仓库中,分析时就不用再重新计算,可大大提高数据仓库运行效率。
为了方便进行数据清洗和转换,可借助临时中间层来进行过渡。抽取来的数据先存储到临时中间层中,在临时中间层进行数据质量检测和数据转换。然后装载到数据仓库中,这样可以大大减少对数据仓库的频繁操作。同时,临时中间层中依然保留非常明细的业务系统数据,在需要时随时可以再次装载到数据仓库中进行较高粒度的分析。
决策支持系统的构建
通过数据采集和加工处理,我们在数据仓库中存储了大量的历史数据和汇总数据。基于数据驱动的决策支持系统的构建,就是以此为基础,充分利用高效的数据分析挖掘手段对数据进行多角度、多层次、动态、高效的统计分析,并以固定报表、即席查询、图形等丰富多彩的数据展现形式提供给前台访问用户,从而为预测、判断、决策提供支持。
联机分析技术和数据挖掘技术都是数据仓库工具,为决策支持系统提供数据驱动。联机分析处理集中于数据的分析,提供多维数据分析、纵向钻取,支持实施数据的切片、旋转功能,能够引导用户对数据从不同层次上进行观察分析,对于同一层次的数据提供组织数据视图的工具,引导用户从不同视角上对同一层次数据进行分析,层次分析与角度分析交互进行,允许用户利用动态表格、动态图形或图表决策分析,同时,通过OLAP可从数据仓库中提取综合数据和信息,产生出新的规则、方法和模型,结果放入规则库、方法库和模型库;数据挖掘技术能找出数据库中隐藏的信息,用模型来拟和数据、探索型数据分析(Exploratory Data Analysis)、进行数据驱动型的发现(Data Driven Discovery)和演绎型学习(Deductive Learning)。运用一种或多种算法对海量数据进行探索,试图发现未知的模式或关系,最终做出预测或总结规律。数据挖掘技术致力于知识的自动发现、从内部获取知识,同时通过专家系统从外部获取专家经验,由推理机制实现了内、外部知识的结合应用,为决策提供辅助性的分析。
数据挖掘和联机分析处理的结果通过报表组件展现在用户面前。报表平台包括三个层面:报表设计层,报表管理层和报表展示层。报表设计层负责报表的脚本定义、模板设计、制作、发布和报表数据生成,报表管理层负责报表集成管理、用户权限管理、角色权限管理,报表展示层利用报表查看器实现报表浏览、导出、打印和图表分析功能,以及对于报表的动态排序、控制数据格式与金额单位的转化。报表平台提供最终用户界面,要求简单易用且功能强大,具有良好的权限控制。
信息化实战
系统原型是一家机械制造加工企业,生产的周期性强,产品需求变化剧烈,企业生产计划和调度面临着管理复杂的内部资源的压力。该企业开展信息化建设较早,包括生产、库存、销售、市场、物流、财务等各个部门已经不同程度的应用着管理信息系统来支持日常业务处理,在长期的企业生产运作过程中积累了大量宝贵的业务数据。在日益激烈的市场竞争环境下,企业迫切希望能够整合内、外部一切可用信息资源,通过综合分析挖掘其隐含的、潜在的关系、趋势等为企业管理和决策服务,提高企业的核心竞争力。
针对企业现状,基于数据驱动建立企业决策支持系统是较好的解决方案。从数据安全考虑,我们在系统实现时没有采用数据仓库与业务系统数据库直联的取数方式,而是采用“前置服务器”双网卡隔离方式,通过自动定时或手工触发来进行数据采集,能够确保网络信息安全。
系统硬件平台分为五层,前置客户端位于各部门业务系统数据库与决策中心前置服务器之间,负责提取数据发送到决策中心。前置服务器负责接收数据,同时作为临时中间层,对数据作清洗、转换并装载到数据仓库中。数据仓库服务器负责数据仓库存储与管理,OLAP服务器负责数据挖掘和联机分析处理操作,报表服务器安装报表引擎,负责报表设计、生成和发布。分别配置如下:前置客户端、前置服务器与报表服务器HP ML350(Intel Xeon主频2800MHz/内存256M/硬盘40G);数据仓库服务器与0LAP服务器HP ML570(Intel-Xeon-MP主频3660MHz/内存1G/硬盘80G)。本实例采用Oracle数据仓库解决方案,IIS5.0服务器作为报表发布平台,用户能随意对不同“指标”上的业务数据进行多种分析比较,很好的满足了企业在多维环境下特定的查询和报表需求。通过综合分析,企业决策层更好的把握了产品的供应、生产、销售、库存的内在联系、规律和趋势,以此为依据合理主动地调整生产计划,实现既定的目标。
基于数据驱动的DSS能够有效的把大量业务历史数据转化为有用的参考信息和决策依据,大大地提高了决策能力、决策水平和决策质量,显示了强大的生命力。相信随着数据挖掘过程的不断简化和在线分析处理功能的不断增强,该系统必将得到更为广泛的应用。
- 1简要分析Wi-Fi是否能承载VoIP
- 2FcoE:分散还是聚合?复杂还是简单
- 3新一代SAS技术浮出水面
- 4企业级数据存储技术和方式分析
- 5企业服务器安全防护的七个切入点
- 6测试IP摄像机的标准和方法探讨
- 7财务管理预则立,不预则废
- 8OA系统相关的报价套餐和合同模板
- 9统一通信向互联互通平台演进
- 10云计算:愈开放,愈“下沉”
- 11虚拟服务器给备份施压
- 12五类IT人员各自该如何应对虚拟化?
- 13IT技术成为组织的核心战略能力
- 14数据中心布线: 节能又省钱
- 15虚拟化成功部署必须突破的5大难关
- 16松散耦合架构SOA“魔方”
- 17后OA时代即将到来了
- 18论EDI与企业电子商务的“前世今生”
- 19用友NC :“企业云”平台扮演双重角色
- 20解读企业虚拟化设备及安全问题
- 21OA办公为模糊查找“订单”的查询结果显示
- 22解决统一通信系统中安全的五个法门
- 23融合制造大势所趋 ODM与EMS已渐行渐近
- 24使用NFS的VMware快照改进方法
- 25从传统归档到云存储归档的演变
- 26技术创新大时代来临
- 27云存储生态系统:从概念到实施
- 28利用现有制冷 巧置机柜机架产品
- 29【新增功能】泛普ThinkOne新增功能
- 30改善磁带存储性能的五种方法