网络容量规划仍在寂寞沙洲?
这是一个在国外蓬勃兴起的领域,在中国却如湖水般静谧。面对顽固的坚持,看容量规划如何在中国的土地上孕育繁华、点燃温暖。
“拣尽寒枝不肯栖,寂寞沙洲冷。”是出自苏轼《卜算子·黄州定惠院寓居作》的名句,它形象地描写了孤鸿惊飞又屡屡回顾的场景,传递了作者被贬官黄州期间无人理解的落寞心情。其笔触之深刻,让后人唏嘘感慨。而“寂寞沙洲”四字所烘托出的清凄寂寥氛围对目前尚未出现启动迹象的网络容量规划非常合适,与其他领域的一派繁荣相比,这里着实显得有点儿冷。
容量规划的“冷”直接体现在用户对这一应用的认知上。当我们就这一话题征询厂商和用户的意见时,反响寥寥。容量规划软件供应商或代理商所提供的用户线索难以捕捉,而一些IT建设相对成熟、颇具应用潜力的用户则明确表示,就现阶段的规划来看,网络容量规划并不处在IT建设的序列之中。
不过,这种淡然处之的态度却从另一方面激发了我们探知的欲望。一个在国外有声有色的领域,在中国为什么会显得如此静谧?当众多国外用户把容量规划当作IT系统升级的“标杆程序”时,国内用户为什么还坚持认为它可有可无?这到底是中国特色,还是应用差距?让我们一起,探个究竟。
冲破带宽瓶颈
对容量规划工具所得出的结果,国外用户开始也报以将信将疑的态度,但事实做出了最好的见证。在国外,容量规划已经成为一种预测IT需求、合理利用IT资源、降低升级成本的有效手段。它被形容为一种真实的“魔法”,容量规划软件内置的数学统计模型就是“魔力之源”,只要将一组组应用数据输入这些数学模型,软件就会分析出系统负载情况,并给出预见性的系统升级方案。
ConocoPhillips是一家总部位于美国的全球化石油企业。前段时间,他们计划为自己在澳大利亚珀斯市的用户推出SAP的商业信息仓库应用。但是,早期系统测试相当不乐观,某些用户在调用SAP应用时,网络延迟达到15秒。驻留在美国服务器上的SAP应用是通过2 Mbps E1网络连接到珀斯的。ConocoPhillips首先想到的是带宽不足,但是要增加新的国际线路,无疑将大幅提升企业今后的系统维护费用,而且新线路的部署至少需要60个工作日。也就是说,当SAP服务推出时,带宽还不可能就位。
左右为难之时,ConocoPhillips找到了容量规划软件供应商Opnet科技公司。后者对该项目进行了长达1400秒的测试,捕捉了一些数据包。Opnet对测试结果进行了分析,并利用数学模型来判断如果美国到澳大利亚的带宽从2 Mbps增至20 Mbps,结果将会怎样。结果显示,即使带宽增加10倍,也只会从这1400秒的时间里减去0.38秒的时间。然后,Opnet还分析了将带宽减至256 Kbps后对网络延迟的影响。结果是,带宽的降低只会在1400秒的时间上增加13秒,损失率不足1%。所以,问题的关键并不是带宽。
Opnet发现,带宽对于网络延迟的影响非常有限,而在承载SAP应用的美国服务器端,却存在着非常大的延迟。在对服务器端合理升级后,ConocoPhillips的问题迎刃而解。现在他们不再需要支付高速国际带宽的昂贵费用,并且已经成为容量规划软件的忠实用户。
技术的渐变
数学统计建模手段的千变万化、不同领域厂商的积极参与,为容量规划技术擎起了一片多彩天空。与所有的预测技术一样,容量规划同样是以数学建模为核心技术的应用,同时,它也在经历着从单一多元的演进。开始,人们只是希望了解CPU、磁盘阵列等独立对象的占用情况,并且找出硬件升级的最佳方案。而随着统计建模手段的日臻完善,现在容量规划工具已经能够承担许多综合应用分析的任务了。
目前,多层建模、多负荷建模的技术被广泛应用,通过这些综合模型,用户可以准确地判断出系统延迟到底是来自数据库、应用,或是Web服务。与此同时,容量规划的应用对象也在迅速泛化,其统治力已经遍及IT环境中的所有环节,其对性能表现的评估也远远超出了传统的压力测试边界。通过安装在不同网络设备中的代理程序,容量规划工具可以收集所需的应用数据,根据数学统计模型测算服务器、存储等设备的容量需求,并且可以跨越多层网络结构和不同的网络操作系统,准确判定网络负载的瓶颈所在。而与基于BI的预测分析不同的是,用户不需要过多参与建模过程,数学模型已经嵌入容量规划工具中,用户只需抽取应用数据并导入模型,即可获知预测结果。
所以,在使用这类工具时,用户的工作重点集中在整个分析流程的前端,即数据收集与处理阶段。用户需要收集企业的资产信息和使用情况,以及它们在系统运营时的具体表现,目前已经有自动化的工具可以完成这一任务,用户只需执行一些指定的操作即可。
如今,这种数据收集正在变成一种持续行为。国外,容量规划师已经成为一种职业,他们要从企业的数百台Linux、Unix、Windows服务器,甚至IBM z系列大型机中提取性能数据,并将数据汇集到SAS的IT资源管理(ITRM)这样的数据仓库中,然后用容量规划工具分析这些数据,将结果汇总到每日、每周和每月的报告中。
与性能数据相比,系统中业务数据的收集就相当富有挑战性了。业务数据包含应用服务的评价标准、企业的个性化数据,以及一些扩展计划。而这些数据在很多情况下IT部门是无法直接获取的,他们需要用各种方式与业务部门周旋,甚至包括哄骗的手法。
数据源确定后,下一步就是处理数据了。用户需要判定哪些才是最重要、最有效的数据资源,以保证数据导入模型后能够得到最准确的结果,同时还要确认这些数据的成份合理,能够实现系统的长期优化。通常情况下,生产性应用、财务、人力资源、预算、采购等属于企业的关键资源,需要对其工作负荷进行重点监控和分析,承载这些应用的服务器往往需要首先安装容量规划的代理程序。
应用数据最终流向了容量规划软件。容量规划软件可以综合统计从实际环境中抽取的性能和业务数据,自动产生分析结果,并且以多种报表的形式将容量评估的结果展示给用户。目前,容量规划在国外已经成为软件的一个专业领域,并且已经诞生了Opnet、TeamQuest这样的容量规划的领先“选手”。
其中,TeamQuest采用了经典的“监控-管理器”架构(如附图所示)。各类数据被集中到管理器中,用户可以管理用以执行报警、报告、检查、预测等容量规划的具体任务。TeamQuest管理器可以管理包括Oralce数据库、SAP R/3、Web服务器、SQL Server、Sybase数据库以及微软Exchange Server在内的多种应用。
在著名网络管理软件厂商BMC最新公布的实现业务服务管理(BSM)的8条路径中,容量规划也占有一席之地。BMC认为,容量的管理与分配可以帮助用户对网络资源配置进行主动优化。BMC的性能预测(Enterprise Performance Assurance)和资源分配(Virtualizer for Capacity on Demand)软件可以从历史趋势和使用报告中进行容量规划,并且实施预见性和自动化的分配。同时,在BMC架构之下,所有的网络性能度量标准和性能与业务数据都被集中到中央数据库中。
与软件代理采集数据不同的是,Netscout公司通过硬件探针收集网络链路层到应用层的流量数据,并通过名为nGenius Performance Manager的软件监测并预测网络的增长趋势。这套“软+硬”的集成方案可以实现应用监控、网络监控、故障排除、服务水平管理等网络管理任务,容量规划是其中的一个功能模块。根据探针所采集的数据,Performance Manager可以快速识别容量不足或过载的网段,帮助用户做出科学的网络优化决策。
在中国“撞墙”
一路奔驰而来、动力强劲的容量规划“列车”,却在中国的边界嘎然而止。就技术而言,发展了10多年的容量规划已经进入相对成熟和稳定的阶段。虽然随着应用的变迁,它正面临着一些困难和挑战,比如虚拟化环境、SOA等,但可以肯定的是,容量规划工具的制造者正在积极改进数学统计模型,以应对这些异变。
而如果排除SOA等新兴技术对容量规划结果的影响,我们看到,对服务器整合、带宽升级、硬件扩容等企业常规基础设施的预测是容量规划工具非常擅长的。在国外,许多用户在进行系统升级时,都会通过容量规划工具进行测算,并将其结果作为最终决策的重要依据。同时,这些工具正变得越来越易于使用,用户几乎不需要培训就能上手,很多软件具备自动发现网络设备和连接的能力,有的工具在菜单中还特别设置了模型配置的快捷方式。
数学模型和易用性的双重改善,将容量规划软件推上了技术发展的波峰。但在中国,这种技术的演进却没有带来启动区域市场的结果。一个在国外蓬勃成长的应用领域,在中国市场却屡屡碰壁,即便将IT应用的“时差”考虑在内,也算得上是一个不大不小的“怪现象”了。
“中国企业IT运维水平不够是容量规划不能普及的主要原因”,现代设备(中国)有限公司的系统顾问谭立勃表达了自己的看法。他所在的公司是TeamQuest在中国内地的代理商,但是公司目前尚无一笔TeamQuest的销售交易发生。谭立勃认为,容量规划是一种高度计算密集型的应用,而目前电信、金融等IT与业务黏性较高的行业,大部分的数据是事务性的。IT应用部署过于分散、单位空间内计算力不足使得这些行业不具备容量规划落地生根的“土壤”。
当我们就容量规划在中国应用的问题征询BMC的答案时,BMC也未能给出明确的用户线索。BMC亚太区的相关负责人表示,容量规划在中国尚未得到足够重视,目前中国的企业中还没有诞生专业容量规划师的角色就很好地说明了这一点。Netscout的nGenius集成化产品在中国已经拥有了100余家用户,不过容量规划模块的实际用户难于统计。该公司产品市场经理段树山坦言,目前用户的需求仍然集中在网络可视性方面,故障排除、网络监控功能是用户关注的焦点。
连续受挫之后,终于有好消息传来。记者辗转得知,中国电信成为了TeamQuest在中国的第一个用户。作为TeamQuest在中国的另一家代理商,深圳中朗科技的副总经理付作军证实了这一消息。他表示中国电信在2004年10月购买了TeamQuest软件,并且已经在广州研究院使用。目前,中国电信正在计划进行二次购买。令人遗憾的是,记者暂时没能联系到中国电信广州研究院的相关负责人,TeamQuest在那里的实际应用情况我们仍然不得而知。但仅从其增加购买计划的举动看,效果应该是正面的。曙光终于出现,却仍有些飘忽。这是容量规划在中国的真实场景。
惯性的堡垒
除了IT运维的因素外,中国企业的IT应用习惯也在“冷却”着容量规划。在国内,当系统负载接近峰值时,企业往往会选择建立新的系统,而不会采用对老系统升级、扩容的做法。而在进行服务器、存储等网络部件升级时,“拍脑袋”式的主观预估也成为习惯,科学精神的遗忘让容量规划渐行渐远。
无法否认,目前国内绝大多数的企业对网络运维ROI没有科学的统计机制,CIO的职责不明确,IT部门也没有严格的绩效评估与量化手段。这种粗放式的IT管理方式助长了这种惯性的泛滥,“扼杀”了对容量规划的需求。
在很多企业中,IT即是“成本中心”。缺少了“精打细算过日子”的念头,当一个应用系统刚一趋近饱和,IT部门就会想当然地“推倒重来”。而仔细研究了几个国外的案例后,笔者发现,国外企业的IT运维已经相当精细化,网络容量的报告可以精确到每一天,系统中服务器、存储、路由器等设备的更换都要使用容量模型进行测算,设备配置的预估被精确到CPU个数或具体的硬盘容量。
国内企业的采购习惯推迟了容量规划需求的形成”谭立勃说。他介绍,目前很多企业的IT规划都比较超前,设备采购高度冗余,这样的系统一般在3~5年内都不会有迫切的升级需求,那么企业对容量规划不积极也就不难理解了。其实,这也从一个侧面验证了中国企业的IT运维水平,3年或5年的远期规划,加上企业惯用的年度调整计划,与国外企业精细到每月、每天的IT运维差距是显而易见的。
当客户缺乏响应时,厂商通常会用服务来刺激用户的消费热情。谭立勃所在的公司也进行了这样的尝试。他们一直在向用户提供容量规划及预测的服务。这些服务大部分是免费的,如果测试过程过于复杂,他们会收取1~2万的服务费用。与容量规划软件几万到几十万的价格相比,这种服务大大降低了用户尝试的门槛,但即便如此,这项服务仍然少人问津。我们也就此询问了几家企业的CIO和CTO,他们对此也没有表现出明显的兴趣。有的企业表示,这种服务所得出的结果准确性不好把握,而服务的费用IT部门很难消化,不知道应该如何报账。
风险在飘移
惯性的堡垒紧紧包裹着用户对容量规划的渴望,而IT运营风险的不确定则让两者之间的距离越来越远,面对一个中国式的“绝缘体”,容量规划的“魔力”瞬间消散。如果按照高精度IT运维的标准圈定容量规划的目标用户,核心业务完全依托于IT平台的Internet网站应该属于容量规划的适用对象。继续依此推算,以新闻传播为主要业务的大众化Internet网站经常遭遇用户访问的潮涌,重大新闻事件发生、节庆期间都可能遭遇网络容量饱和或溢出的状况。那么,他们应该非常需要容量规划工具才对。
然而,事实并非如此。我们就网站容量问题专门采访了千龙网的技术总监孟曦东,得到了有些意外的答案。孟曦东认为,现阶段,网络容量对于网站来说并不是个棘手的问题。他介绍,外界变化时刻影响着Internet站点的网络峰值,由于这些变化网站很难把握,为了保证IT服务水平,网站一般采取高冗余建设的做法,并且广泛部署了CDN(Content Delivery Network,内容传输网络)系统。CDN可以将网络访问的压力分载到设在不同地理位置的服务器上,这种针对Internet网站的负载均衡机制,可以合理地分流用户访问。
CDN能够“稀释”网站突发性的流量增长,而除了技术上的努力外,网站还在服务采购上做文章,成功地将容量风险转移到网站之外。孟曦东介绍,网站与网络运营商签订服务合同时,往往会注明一些特殊条件,比如在访问峰值时不限流量等;同时,在部署CDN网络时,网站通常采取与当地网络运营商合作的方式,这种方式的好处在于,当流量出现潮涌时,网络服务商会进行负载调整,这一过程网站并不需要参与。他表示,实践证明这些做法是非常有效的,神舟6号发射、十运会等重大新闻事件发生期间,千龙网的页面访问数和并发点击数多次达到历史峰值,但是这些访问被成功地消化了,网站运行平稳,访问端的延迟也在规定的范围以内。
“网络容量影响互联网站的情况尚未出现”,孟曦东说,这应该是具有代表性的客观结论。而网站这种从容的心态,与网络服务商乐于承担风险直接相关。在网络服务市场激烈的竞争中,网站可以在服务租用的过程中渔利,这是中国网站的“特权”。而在网络容量风险转嫁之后,容量规划对于Internet网站失去了“最致命的吸引力”。
寻找根据地
想要植根中国的国土,容量规划需要的是一个合适的角度,还有一个准确的落脚点。技术革新的火焰无法“熔化”中国市场,但这并不能成为就此胆怯的理由。随着容量规划对于企业IT资源优化的作用得到了越来越多国际企业的认同,我们完全有理由相信,它终有一天会在中国大有作为。即使今天,这里还是一片寂寞沙洲,但就像在荒芜中孕育繁华、在寒冷中点燃温暖一样,一旦用户需求得以释放,容量规划的前景仍然是不可限量的。
有专家说,时间是容量规划普及最需要的东西。随着时间的推移,当企业IT运维和针对IT部门的绩效评估达到一定的临界值时,容量规划将会实现高速启动。但是,除了等待之外,积极的市场发掘仍是必须的。虽然这样无法实现大规模的用户积累,但少数用户的示范价值将在日后成倍地释放出来。
谭立勃认为,就用户数据基础而言,芯片厂商应该是最具潜力的应用对象,因为他们已经具备了高集中、高密集计算的典型特征。BMC表示,容量规划在金融、电信等行业的应用开发环节很有施展拳脚的空间,可以用来评估应用的性能表现、投产测试等。孟曦东则认为,鉴于目前容量风险集中在网络服务供应商一端的普遍情况,针对主干网的容量管理与分配应该是容量规划工具率先尝试的领域。
“集中、高端”已经成为容量规划市场突破的关键词。在前进的路线上,有专业人士预测,容量规划很可能会先在研究机构着陆,成为一种科研工具,再逐渐向企业应用渗透。最近,记者得知,一家正在全力开拓国际市场的本地知名网络设备供应商正在筹划自行开发容量规划软件。对于逡巡已久的容量规划来说,这绝对是一个利好消息。内外合围,有可能会促动本地应用潜力的快速迸发。
附表 容量管理技术概览 | |||||
方法 | 线性趋势分析 | 多变量趋势分析 | 负荷测试 | 多层建模 | 多负荷建模 |
测量内容 | 占用率 | 占用率 | 响应时间 | 响应时间 | 响应时间 |
使用领域 | 单个硬件资源(服务器、磁盘) | 硬件资源 | 应用(测试环境) | 应用及基础设施 | 应用及基础设施 |
预测有效性 | 仅限于现有的硬件配置 | 仅限于现有的硬件配置 | 仅限于现有的硬件配置 | 现有基础设施及构想中的未来基础设施 | 现有基础设施及构想中的未来基础设施 |
响应时间/服务水平预测 | 否 | 否 | 是,但限于受测的基础设施 | 是 | 是 |
预测实际响应时间的精确程度 | 低 | 低 | 粗略估计生产环境中的性能 | 高 | 高 |
条件分析及预测 | 否 | 否 | 限于不断变化中的负荷水平 | 是 | 是 |
编看编想:没有打不破的包围圈
也许是在素材收集和采访过程中听到了太多负面的消息,让我们不得不谨慎地思考容量规划技术与中国应用特色之间的微妙关系。前面提到,惯性等因素将容量规划的需求紧紧包裹起来,用有些人的话说就是,这是个厂商不爱推,合作伙伴不合作,用户不感兴趣的领域。但是,中国企业在IT建设中频频犯下的错误、每每痛心疾首的教训又证明了,中国企业非常需要一种科学的工具实现对IT系统成长的宏观及微观的把握。如果站在这一角度,容量规划对中国企业的意义无疑是非常深远的。
对这个选题的坚持证明了我们还没有麻木。而后来的事实也证明,虽然目前需求不够旺盛,但是容量规划工具已经开始在高端研究领域投入应用,同时它在国际市场的成功也已开始为国人所关注。虽然市场整体仍处在静默状态,但仔细聆听后,仍能感受到一股股脉动。
脉动暗示着生命力。与此同时,容量规划功能的进一步锐化也有效地增加了其自身的攻击力。国外的资料显示,最新的容量规划工具不仅可以胜任阶段性的升级需求测算,还可以对运行场景进行实时分析,实现对IT瓶颈的快速查找与化解。技术的创新正在压缩容量规划操作所需的时间,以便帮助用户更从容地应对业务对IT需求的变化。而这些浓缩后的新技术,很有可能激荡起用户关键的“兴奋神经”。笔者认为,这种主动的自我改变将更大限度地张扬容量规划的生命力,并由此实现对“寂寞沙洲”的征服。
对一支真正骁勇善战的军队来说,没有打不破的包围圈。(CCW)
- 1应用程序也“虚拟”
- 2用围棋理论指导布线施工
- 3通信软件开源之路
- 4身份认证与管理:下一个安全部署重点
- 5沈阳泛普OA软件的提醒信息树状列表
- 6流媒体服务器架设简明攻略
- 7解析ISO17799方法
- 8IT安全魔与道的反复较量
- 9安全什么是“主动”的真义
- 10信息安全:过去五种影响最大的攻击
- 11OA系统的设置主要注意以下几点:
- 12开源软件是否更安全
- 13沈阳OA软件的个人办公的优势是什么?
- 14解析八种常见的ADSL断流现象
- 15制造系统将如何演变
- 16信息安全风险评估有据可依
- 17解决信息系统的“亚健康”问题
- 18时段分析模块的设计
- 19管理新型存储系统的7点提示
- 20IPv6对网络安全的改进与挑战
- 21超小型UPS选购技巧
- 22智能布线管理系统走上台前
- 232005年网络十大融合看点
- 24Web服务与网格计算融合
- 25网站项目模型及业务流程分析
- 262006年影响全球商业的技术是什么?
- 27IRP工具能做什么
- 28磁盘备份优劣谈
- 29服务基础架构软件加速企业SOA实施进入新阶段
- 30怎样编织家中“线网”