泛普软件分析聚焦爬虫技术和特定主题—OA 资源
泛普软件分析聚焦爬虫技术和特定主题—OA 资源
1 聚焦爬虫技术
泛普软件通过文献检索获知:聚焦爬虫(Focused Crawler)又称为主题爬虫(Topical Crawler),它的工作流程(如图1)比传统网络爬虫复杂一些,在抓取页面并提取出URL以后,会根据相应的URL分析算法保留尽可能多的主题相关度高的URL,并将其放入等待抓取的URL队列;与主题无关或相关度不高的URL将被丢弃。然后再从URL队列里读取URL进行抓取,并重复上述过程,直到满足爬行停止条件为止。而且,聚集爬出的系统中有专门的数据库,用来存贮被爬虫抓取的网页,并有专门的功能模块对网页进行内容分析、特征词提取,从而建立起相应的主题特征词库。特征词库建立以后,可以更好的对之后抓取的网页进行分析和评价,把与主题无关或相关度不高的网页排除。
2 特定主题—OA 资源
泛普软件通过文献检索获知:Open Access即开放存取,简称OA,2002年2月14日发表的《布达佩斯开放存取计划》对OA做了如下的定义:“古老的学术传统和崭新的技术已经结合起来,可能将给公众带来空前的利益。古老的学术传统是为了接受咨询和传播知识的目的,在毋需付费的条件下,科学家和学者们很乐意将自己的研究成果发表于学术期刊上。崭新的技术是英特网。这种结合可能将给公众带来的利益就是:经过同行评价的期刊文献可以被所有的科学家、学者、教师、学生以及其他充满好奇心的人在全球范围内发布其电子文本并可以完全免费的、无限制的使用。消除对这些文献的存取障碍将会加快研究的速度,使教育更加丰富多彩,富人与穷人之间互相共享彼此的学问,从而使这些文献达到最大限度的利用,并在共同的理智交流和知识的追求中建立人类联合的基础。这种免费的无限制的联机获取方式,称之为开放存取(open access)。”
Open Access是国际科技界、学术界、出版界、信息传播界为推动科研成果利用网络自由传播而发起的运动。通过网络技术,任何人可以免费的获得各类文献。
此文章为泛普软件所写,转载请留版权,泛普软件专注OA,OA系统,OA办公系统,OA软件,OA办公软件。 www.fanpusoft.com
泛普软件编辑
- 1工作流程来剖析存包箱管理OA软件存包箱管理系统的实现流程
- 2集团协同办公系统(OA)建设项目-集团信息化应用系统总体技术要求
- 3协同OA办公系统与NC ERP系统集成的方案技术指导
- 4OA系统的项目目标包括以下三个方面:
- 5泛普软件分析公共图书馆OA系统资源发展
- 6信息环境下OSSP的目标和基本思想及OA办公系统的应用
- 7OA办公自动化软件的整体亮点四:血脉
- 8OA办公自动化软件以柱状图、饼图方式显示
- 9OA办公系统中CRM的广泛应用与基础应用功能
- 10企业管理的辅助工具有哪些?
- 112015年泛普软件将推动国内OA系统(办公自动化)广泛普及
- 122015-2016年国内哪一家OA办公系统最好呢?
- 13OA办公自动化管理系统的研究及应用起步较晚、水平较低
- 14泛普软件协同OA系统在系统中的结构体系
- 15协同OA办公软件系统财务费用报销流程图
- 16OA软件管理平台设计理念及技术特点是什么?
- 17泛普软件( www.fanpusoft.com)推出的OA系统主要以下八个模块
- 18企业OA软件系统的工作交流自动化管理平台
- 19泛普软件告诉您企业OA办公自动化系统实现的可行性分析
- 20OA办公系统为大家进行简单介绍
- 21OA办公自动化的集团化平台技术支撑体系
- 22研究县级政府OA系统设计都有哪些需求呢?
- 23协同OA软件中流程的配合使用有什么好的作用呢?
- 24OA办公系统有哪六易标准呢?
- 25聚焦蜘蛛爬虫体系对OA办公软件行业的网站的作用及功能分析如下
- 26泛普OA软件中人力资源部的CRM应用
- 27OA系统中的信息发布共享模块
- 28泛普软件推出的基于B/S模式的OA系统
- 29广东高校OA自动化系统使用现状与分析
- 30OA办公软件系统5.0 项目管理功能使用指南