怎样为数据分类
企业要确保数据安全、遵从法规、存储分层和满足新调查取证需要的努力,取决于所采用的好的数据分类方法。
依赖于系统元数据的传统分类法缺少全面的内容可见性,因为Windows的CIFS和Unix的NFS只提供8种分类元数据类,如文件名、目录名、文件长度、类型与修改或访问日期。
这些基本解决方案证明无法满足IT对准确数据分类的要求。这种情况导致了所谓信息分类与管理(ICM)的市场细分的出现。这类工具提供文件路径元数据解析、文件中内容可见性、上下文种类分类、文件分类标签以及基于策略的管理与跟踪等高级特性。
可惜,其中的一些解决方案由于它们基本架构(即关系型数据库和/或企业搜索引擎)的原因,仍存在严重的性能、可扩展性、灵活性和功能问题。
企业搜索引擎证明,完全能够满足基于Web的搜索的需要,Google和其他一些搜索引擎也证明了这点。它们的局限性可能使它们难于使用,很多IT专业人员发现它们不适合企业环境中的ICM要求。可以将搜索想象为,为找到几个字而构建一部字典。人们必须首先建立所有文件中的所有字的庞大索引。
这一过程十分缓慢并可能消耗大量的存储空间。
针对ICM的高级解决方案,必须超越搜索范围提供真正的信息数据挖掘。这包括找到保存在不安全位置中的社会保险号、信用卡号、源代码或保密信息的能力。它们还必须能够找到类似姓名、公司名、账户号或诉讼案名的数据,甚至找到电子报表单元中的数据。
一些工具可以利用模式或上下文识别来检测文档摘要或主题。这可以提供类似于搜索的可见性,但增加了确保John Apple按姓名而不是按公司或水果类分类的上下文关系。
在更大型的企业中,分散在不同位置中的文件必须被找到和分类,一些基于关系型数据库的解决方案难以完成这项任务。所需要的是某种超越块数据库架构并提供类似网格的数据库技术。
这需要一种使数据库不同部分保存在远程位置或单个PC上,而不是保存在中央数据库中的新型分布式数据模型。
将分类的数据转移到相应的数据库需要策略引擎。策略引擎从数据分类开始,包括文件标签。数据值必须在建立策略之前被知道,而成功的策略引擎必须摆脱文件存根或快捷键。此外,所有的文件目录结构,包括访问控制列表都必须被转移。这必须在异构的存储环境中完成,不管部署的是什么存储系统。
标签必须通过业务用户与IT专业人员之间的简短会面,像创建MP3音乐程序中的播放列表一样容易。在这些会面中,IT专业人员和部门负责人可以就什么是关键信息、保密信息或敏感信息达成一致,然后根据布尔搜索序列标记文件。之后,可以建立策略来正确地管理和跟踪这些文件。
IT专业人员应当将数据分类过程视为在降低费用和减少复杂性的同时为业务增加价值的机会,而不是将它视为负担。(美国《Network World》供本报专稿)
(ccw-cnw)
- 1ERP实施顾问心得分享
- 2国内市场虚拟化大战开启
- 3有了ERP,还缺什么?
- 4知名度最好的OA办公软件系统是哪一家
- 5开源ERP你会用吗?
- 6为数据中心瘦身
- 7武汉OA办公软件,哪家比较好?哪家公司做的不错的?
- 8中小企业如何成功完成BPM与其他应用的整合
- 9中间件采购更实际
- 10商业智能推动中小企业创新
- 11数据中心节能7招
- 12ERP项目实施沟通管理研究
- 13协同OA将数据分析融入到企业癿整个管理过程当中
- 14整合仍然是中国企业SOA的关键词
- 15EDA 风雨欲来
- 16五花八门的RFID应用
- 17武汉本地的OA软件厂商比较少,有的话也应该实力不强
- 18管理软件厂商需走产品多元化道路
- 19一瞥若干全球BPM的假定
- 20VoIP提供商开始将目标转向小型企业
- 21设计成本攀高PLM依旧没人爱
- 22ITIL v3开启新征程
- 23EMC收购RSA初见成效 信息安全之路步向前
- 24企业软件交付方式类型及实施策略
- 25沪士电子PLM系统的实施分析
- 26软件巨头角逐智能世界
- 27怎样为数据分类
- 28现代企业的e-HR战略
- 29网络管理员减负法宝
- 30IT系统整合的三门“必修课”