帮助 关于我们

返回检索结果

基于机器学习的网页暗链检测方法
Detection Method for Hidden Hyperlink Based on Machine Learning

查看参考文献15篇

周文怡 1   顾徐波 2   施勇 1   薛质 1  
文摘 在大数据时代下,传统暗链检测技术无法在海量网页中快速准确地识别出遭遇“暗链攻击”的网站.为此,提出一种引入机器学习的方法研究网页的暗链检测.该方法结合暗链的域名、相关文本及隐藏结构3种特征,分别采用分类与回归树、梯度提升决策树及随机森林3种算法来构建检测模型并对比其的性能.实验结果表明,该方法具有较高的准确性和可靠性,其中随机森林构建的检测模型分类准确率可以达到0.984.
其他语种文摘 In the era of big data,traditional hidden hyperlink detection technology cannot quickly and accurately identify websites that encounter“hidden hyperlink attacks”on massive Web pages. To solve this problem,this paper introduces machine learning to the detection method for hidden hyperlink,which combines the characteristics of hidden hyperlink related texts,hidden hyperlink domains and the hidden structure of hidden hyperlink. The three models are constructed and compared using Classification and Regression Tree ( CART ),Gradient Boosted Decision Tree ( GBDT ) and Random Forest ( RF). based on the proposed method. Experimental results show that the proposed method has high accuracy and reliability, and the classification accuracy of the detection model constructed by RF can reach 0.984.
来源 计算机工程 ,2018,44(10):22-27 【扩展库】
DOI 10.3969/j.issn.1000-3428
关键词 暗链 ; 特征提取 ; 交叉验证 ; 分类与回归树 ; 随机森林 ; 梯度提升决策树
地址

1. 上海交通大学网络空间安全学院, 上海, 200240  

2. 上海交通大学机械与动力工程学院, 上海, 200240

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 自动化技术、计算机技术
基金 国家自然科学基金重点项目
文献收藏号 CSCD:6345006

参考文献 共 15 共1页

1.  ScienceChina 中国科学文献服务系统

您还没有权限

 


请您 返回ScienceChina—中国科学文献服务系统首页重新检索,如果您在使用ScienceChina—中国科学文献服务系统遇到问题。

销售咨询联系:

北京中科进出口有限责任公司

联系电话: (010) 84039345-635

电子邮件:chuw@bjzhongke.com.cn

联系地址:北京市东城区安定门外大街138号皇城国际大厦B座801 100011

服务咨询联系:

中国科学院文献情报中心

联系电话: (010) 82627496

传 真:(010) 82627496

电子邮件:cscd@mail.las.ac.cn

联系地址:北京市 海淀区 北四环西路33号 100190

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号