文摘
|
为了提高网络爬虫的效率,作者针对互联网中的大量格式良好,页面中链接更新频率高的网页,分析这类网页在互联网中发现新信息的重要性,重新定义了网页变化的概念,利用Possion过程和Markov更新过程设计了一种高效监测这类网页中的链接变化情况的模型,并用实验证明了这种模型的有效性. |
其他语种文摘
|
In order to improve the efficiency of web crawler, facing with the kind of web pages which are well-formatted and with a high frequent update with their links, the author briefly analysis their importance in finding new contents in the internet, redefine the concept of web change and focus on designing a mathematical model of monitoring the changes of their hyperlinks based on Poisson process and Markov queuing process, then prove the efficiency of the model with the aid of experiment. |
来源
|
微计算机信息
,2009,25(6):153-154,130 【扩展库】
|
关键词
|
单-index型网页
;
网页变化
;
Poisson过程
;
Markov排队过程
|
地址
|
中国科学院新疆理化技术研究所, 新疆, 乌鲁木齐, 830011
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1008-0570 |
学科
|
自动化技术、计算机技术 |
文献收藏号
|
CSCD:3610156
|