帮助 关于我们

返回检索结果

基于语义的中文文本关键词提取算法
Semantic-based Keyword Extraction Algorithm for Chinese Text

查看参考文献9篇

文摘 为克服传统关键词提取算法局限于字面匹配、缺乏语义理解的缺点,提出一种基于语义的中文文本关键词提取(SKE)算法。将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。实验结果表明,与基于统计特征的关键词提取算法相比,SKE算法提取的关键词能体现文档的主题,更符合人们的感知逻辑,且算法性能较优。
其他语种文摘 In order to overcome the limitation of literal matching and lacking semantic concept of the traditional Keyword extraction algorithm,this paper presents a Semantic-based Keyword Extraction(SKE) algorithm for Chinese text.It uses semantic feature in the keyword extraction process and constructs word semantic similarity network and uses betweenness centrality density.Experimental results show that compared with the statistic based keyword extraction algorithm,the keywords SKE algorithm extracted are more reasonable and can represent more information of the document’s topic,and the SKE algorithm has a better performance.
来源 计算机工程 ,2012,38(1):1-4 【核心库】
关键词 关键词提取 ; 语义相似度 ; 词语语义相似度网络 ; 居间度 ; 中文文本
地址

中国科学院软件研究所, 基础软件国家工程研究中心, 北京, 100190

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 自动化技术、计算机技术
基金 国家自然科学基金资助项目 ;  国家863计划
文献收藏号 CSCD:4435526

参考文献 共 9 共1页

1.  姜亚莉. 用于Web文档聚类的基于相似度的软聚类算法. 计算机工程,2006,32(2):59-61 被引 1    
2.  张敏. 一种利用BC方法的关键词自动提取算法研究. 小型微型计算机系统,2007,28(1):189-192 被引 11    
3.  程涛. 基于同义词词林的中文文本主题词提取. 广西师范大学学报: 自然科学版,2007,25(2):145-148 被引 4    
4.  张虹. 基于自动文本分类的关键词抽取算法. 计算机工程,2009,35(12):145-147 被引 6    
5.  刘群. 基于《知网》的词汇语义相似度计算. 第三届中文词汇语义学研讨会论文集,2002 被引 6    
6.  张颖颖. 基于同义词链的中文关键词提取算法. 计算机工程,2010,36(19):93-95 被引 8    
7.  Agirre E. A Proposal for Word Sense Disambiguation Using Conceptual Distance. Proc. of International Conf. on Recent Advances in Natural Language Processing,1995 被引 1    
8.  Brandes U. A Faster Algorithm for Betweenness Centrality. Journal of Mathematical Sociology,2001,25(2):163-177 被引 117    
9.  何新贵. 中文文本的关键词自动抽取和模糊分类. 中文信息学报,1999,13(1):9-15 被引 16    
引证文献 11

1 王锦波 一种改进的朴素贝叶斯关键词提取算法研究 计算机应用与软件,2014,31(2):174-176,181
被引 1

2 沈佳杰 基于关键词的云计算语义文本自适应分类 计算机工程,2014,40(7):247-253
被引 0 次

显示所有11篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号