帮助 关于我们

返回检索结果

一个预测网页变化的增量式更新模型
An incremental refreshing model for forecasting the changes of web pages

查看参考文献6篇

文摘 为了提高网络爬虫的效率,作者针对互联网中的大量格式良好,页面中链接更新频率高的网页,分析这类网页在互联网中发现新信息的重要性,重新定义了网页变化的概念,利用Possion过程和Markov更新过程设计了一种高效监测这类网页中的链接变化情况的模型,并用实验证明了这种模型的有效性.
其他语种文摘 In order to improve the efficiency of web crawler, facing with the kind of web pages which are well-formatted and with a high frequent update with their links, the author briefly analysis their importance in finding new contents in the internet, redefine the concept of web change and focus on designing a mathematical model of monitoring the changes of their hyperlinks based on Poisson process and Markov queuing process, then prove the efficiency of the model with the aid of experiment.
来源 微计算机信息 ,2009,25(6):153-154,130 【扩展库】
关键词 单-index型网页 ; 网页变化 ; Poisson过程 ; Markov排队过程
地址

中国科学院新疆理化技术研究所, 新疆, 乌鲁木齐, 830011

语种 中文
文献类型 研究性论文
ISSN 1008-0570
学科 自动化技术、计算机技术
文献收藏号 CSCD:3610156

参考文献 共 6 共1页

1.  J Cho. Synchronizing a database to improve freshness. Proceedings of the 2000 ACM SIGMOD Intemational Conference on Management of Data,2000:117-128 被引 1    
2.  J Cho. Estimating frequency of change. ACM Trans.On intemet Technology,2003,3(3):256-290 被引 10    
3.  Tao Meng. The Evolution of Link-Attributes for Pages and Its Implications on Web Crawling. IEEE/WIC/ACM International Conference on Web InteHigence(WI04)?:578-581 被引 1    
4.  Ziyang Wang. Incremental Web Search:Tracking Changes in the Web,2006 被引 1    
5.  孟涛. 网页变化与增量搜集技术. 软件学报,2006,17(5):1051-1067 被引 7    
6.  徐远超. 基于Web的网络爬虫的设计与实现. 微计算机信息,2007(07/3):119-121 被引 5    
引证文献 0 篇
论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号