企业怎么选监控软件
随着计算设备和软件数量及复杂性的增加,系统状况的监控工作不能再仅仅依赖手工完成。特别是监控软件必须能够进行持续检测,确保所有的计算机和网络设备以及软件都能正常工作。
企业工作效率和竞争能力的提高依赖于计算机、网络和数据库。为了保持业务的高效运行,所有的系统都必须运转正常。在今天的IT环境里,不同厂家的计算设备被用来满足多种业务需求。如果任何一种资源发生错误,就会造成极严重的后果。
根据Gartner保守估计,企业计算机网络停用一小时的平均成本为42000美元。另外Gartner还估计企业一般每年会经历87小时的停用时间。如果一家企业成功运用监控技术,将一年的停工时间从175小时缩短到平均的87小时,就可以节省360万美元。
Gartner特别指出,当关键服务器和网络崩溃时,企业将依次在生产能力、声誉损失和财务表现方面付出代价。据USA Today报道,仅在1999年,美国企业因网络故障一项就损失将近1000亿美元。Standish 集团估计,一般规模的企业在关键任务的应用不能使用时,每分钟的损失为1万美元。规模更大的公司每分钟损失可能高达几百万美元。
当故障发生时,尽量缩短停用时间是减少对业务影响的关键。如果某家企业号称“全球每周七天,每天24小时开通”的网站无法使用,企业在销售、与客户的联络、市场影响力以及业务发展等方面都会受到影响。这样的损失往往无法估量。
系统的故障会切断企业的联络线。经常出现的故障可使企业对这些高效业务工具丧失信心,减少相应的投资回报。
保证系统全天持续运行的IT企业需要满足以下需求:
系统监控技术可以帮助保持关键系统全天可用。
监控系统的实施速度应够快,并且易于维护。IT企业既没有时间也没有资源进行长时间的安装和复杂的维护。
深入应用、系统和数据库级的监控以及实时数据和历史统计数据可用来发现系统故障前兆。
用于发现问题的工具应该可以解决问题。
不同厂家的监控、维护和管理解决方案应该集成于一个中心控制台。
全面的全网状况监控能力以及获取指定数据的能力。
简单灵活的许可方式。复杂的按每次检查或者每个模块进行许可的方式会增加隐藏的成本。不同的组成部分使得安装困难,而且也很难估计产品使用周期里的整体拥有成本。
传统监控解决方案存在的问题
为了减少和消除计算停用造成的中断,HP,IBM和CA这样的主要厂商都推出了监控解决方案。网络和系统(NSM)监控软件占据了IT预算的一大块。仅在2004年,企业在此类产品上的花费就达到71亿美元。
这些产品不仅价格昂贵而且安装、管理和维护都很困难。这些解决方案除了高昂的成本以及高度复杂性以外,还存在以下的问题:
许多企业没有正式使用监控技术。
许多企业未能使用或者放弃使用监控方案的计划。
许多企业只使用低端监控系统,使用部分解决方案而放弃关键的功能。
IT组织机构需要的功能
以下功能对于高效NSM解决方案来说至关重要:
基于互联网和Java的结构
软件应由Java写成并专为基于网络的环境所设计。由于仅在单一服务器内使用,基于网络的零客户端系统只需要非常简单的软件发送方式或者升级机制。另外,这一系统应该可以从任何地址进行安全访问和管理,而不需要额外的客户端软件。
大部分传统系统监控产品在互联网普及之前所设计,系统一般都基于客户端服务器,基于网络的报告能力也有限。这些系统都需要在中央服务器和客户端进行升级和打补丁。
简单直观的网络界面
系统管理员应该不需要经过漫长的培训就可以快速容易的掌握系统功能。理想情况下,应该使用用户所熟悉的界面,如树型控制,标签,图形以及表格式数据等,使得操作者和管理员可在一天之内快速掌握。
自动技术
传统应用的安装和配置一般需要3到9个月时间。往往还需要大量的咨询服务,极大的提高了拥有成本。自动技术研究服务器、网络设备和软件应用,收集并整理性能方面的统计数字,将安装时间从数月缩短为数天。它将烦琐重复的配置和维护工作自动化,使用精心设计的缺省或者模板来满足企业90%以上的需求。
标准化
J2EE, SNMP, WBEM和JDBC等行业标准的应用使得监控技术与其它技术的集成更为容易,并且可以降低全面的支持和维护成本。通过利用行业标准,ISP工程师团队对行业变化的反应速度更快;对工程方面的投资也获得更加高效的解决方案。
无需大量代理程序
许多传统系统监控厂商必须在系统中安排大量的代理。这些代理程序在与管理站连接时要占据带宽和每台监控服务器上的资源。另外,当产品需要升级或者打补丁时,网络上所有的系统都要进行升级。
还有一种更具创新性的简单网络管理协议(SNMP)取代了代理被应用于大部分网络。使用用户数据通信协议(UDP)与代理连接只需要很少的带宽。另外,当操作系统需要升级和打补丁,SNMP代理也由系统厂商进行升级和打补丁,简化了监控系统的全面维护。
零MIB的SNMP结构
MIB是SNMP性能统计数字生成的管理信息库。不同厂商使用不同的MIB。典型系统要求用户编译MIB,选择监控变量、建立图表并设置极限。由于一个单独的厂商就拥有超过50万个变量,所以这一过程本身就需要数月时间。
NSM自动技术测定每个节点的SNMP性能,并应用数据收集模板。基于此模板,监控程序自动收集被推荐的SNMP数据,生成历史趋势图表,并应用于预先确定的、经推荐的数据极限模板。
人为事务
许多低端产品只使用互联网控制消息协议(ICMP)进行监控。如果80端口对ping有响应,软件就记录HTTP服务器可操作。但是,ICMP监控不能核对预报的相应字符。有没有更好的方法可以确定某个服务是否正在运行呢?可进行完全综合报告来确保应用状况被正确的反应。这一方法通过后台软件发出一个人为的,或者说是假的事务来测量反应速度。理想的解决方案允许系统管理员以数种可支持的语言书写自定义模拟器,对内部应用进行人为事务的测试。
预先集成的捆绑式结构
许多用于操作系统、数据库、报告软件包和通告软件的NSM需要付出额外的成本,如培训、配置、维护和调整。
一个完整的捆绑式的解决方案包括完整应用,如操作系统、网络服务器、Java服务器以及内置数据库,所有需要购买、配置和安装更多的产品服务。
门户架构
门户架构使IT企业可以在一个操作界面上集成惯用的工具和应用。也符合一般的安全结构并支持常见的混合应用的界面风格。
基于真实体验的操作模式
高效NSM操作模式是运行大规模商用数据中心所获得的经验的产物。模式应该包括以下内容:
任务进程表——标准配置中的一部分,可使工程师被呼叫时得到通知。
技术性分组——使消息得以被正确的分配给组内成员。例如Oracle数据库通知应发给数据库管理员,而网络停用消息应发给网络工程师。
资产管理器——缩短由于地址无效或者设备访问失败造成的停用时间。资产管理允许管理员存储设备地址、访问需求以及厂家联系方式等关键非技术性信息。
标准操作程序 (SOP)和文件管理器——允许操作者标注如果处理问题和网络事件的说明。例如,如果Oracle数据库的制表空间已满,数据库管理员应该可以连接到扩展制表空间的说明,并作出相应处理。
自动响应——允许系统管理员对常见问题的标准响应。例如,如果HTTP服务不能使用,自动响应应该能够快速进行重启。
正确的解决方案
网络和系统管理解决方案应该可以解决企业执行或者对NSM成本和复杂性方面所担忧的问题。正确的解决方案,如CITTIO公司的WatchTower这样的产品,具有如下性能:
执行起来快速、简单
与传统解决方案相比全面投入更少
坚实的行业标准基础
基于数据中心管理经验的操作模式
许可方式简单
消除繁重的代理
支持个性化定制、对新技术快速接纳和安全的门户架构
支持互联网的管理和监控工具
通过单一界面进行全天候系统控制(zdnet)
- 1重组运维中心的“四项基本原则”
- 2软件工程化正在成为核心和具有创造性的资产
- 3如何管好多个IT外包项目?(下)
- 4企业ERP软件的三种模式
- 5企业电子用户的工作环境
- 6Linux版中小企业管理软件适用吗?
- 7用质量管理风险
- 8怎样挖掘供应链协同网络的潜能
- 9—元数据管理技术及应用现状
- 10石家庄OA软件的档案管理系统主要需求点
- 11了解IDM软件的价值
- 12全面破解中小企业的整合问题
- 13如何建设生态文明?如何保证经济的可持续发展?
- 14ERP价格为什么这样低?
- 15数据仓库应用行业有别
- 16E-learning架构构想
- 17如何解决中小企业信息化满意度低
- 18如何架构一个BI系统
- 19VoIP也外包:既省钱又灵活
- 20ITIL执行方案:定义你的最佳做法
- 21软件外包进入重组整合阶段
- 22警惕软件租用的十大陷阱
- 23电子商务呼唤电子法务
- 24信息权力的透明隧道
- 25网管软件选购要注意什么?
- 26将企业声望管理纳入日程
- 27怎样保护VoIP网络
- 28中小企业IT采购22条经验
- 29中小制造企业创造新的竞争优势
- 30怎么样给企业级防火墙“体检”