|
基于语义的中文文本关键词提取算法
Semantic-based Keyword Extraction Algorithm for Chinese Text
查看参考文献9篇
文摘
|
为克服传统关键词提取算法局限于字面匹配、缺乏语义理解的缺点,提出一种基于语义的中文文本关键词提取(SKE)算法。将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。实验结果表明,与基于统计特征的关键词提取算法相比,SKE算法提取的关键词能体现文档的主题,更符合人们的感知逻辑,且算法性能较优。 |
其他语种文摘
|
In order to overcome the limitation of literal matching and lacking semantic concept of the traditional Keyword extraction algorithm,this paper presents a Semantic-based Keyword Extraction(SKE) algorithm for Chinese text.It uses semantic feature in the keyword extraction process and constructs word semantic similarity network and uses betweenness centrality density.Experimental results show that compared with the statistic based keyword extraction algorithm,the keywords SKE algorithm extracted are more reasonable and can represent more information of the document’s topic,and the SKE algorithm has a better performance. |
来源
|
计算机工程
,2012,38(1):1-4 【核心库】
|
关键词
|
关键词提取
;
语义相似度
;
词语语义相似度网络
;
居间度
;
中文文本
|
地址
|
中国科学院软件研究所, 基础软件国家工程研究中心, 北京, 100190
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1000-3428 |
学科
|
自动化技术、计算机技术 |
基金
|
国家自然科学基金资助项目
;
国家863计划
|
文献收藏号
|
CSCD:4435526
|
参考文献 共
9
共1页
|
1.
姜亚莉. 用于Web文档聚类的基于相似度的软聚类算法.
计算机工程,2006,32(2):59-61
|
CSCD被引
1
次
|
|
|
|
2.
张敏. 一种利用BC方法的关键词自动提取算法研究.
小型微型计算机系统,2007,28(1):189-192
|
CSCD被引
11
次
|
|
|
|
3.
程涛. 基于同义词词林的中文文本主题词提取.
广西师范大学学报: 自然科学版,2007,25(2):145-148
|
CSCD被引
4
次
|
|
|
|
4.
张虹. 基于自动文本分类的关键词抽取算法.
计算机工程,2009,35(12):145-147
|
CSCD被引
6
次
|
|
|
|
5.
刘群. 基于《知网》的词汇语义相似度计算.
第三届中文词汇语义学研讨会论文集,2002
|
CSCD被引
6
次
|
|
|
|
6.
张颖颖. 基于同义词链的中文关键词提取算法.
计算机工程,2010,36(19):93-95
|
CSCD被引
8
次
|
|
|
|
7.
Agirre E. A Proposal for Word Sense Disambiguation Using Conceptual Distance.
Proc. of International Conf. on Recent Advances in Natural Language Processing,1995
|
CSCD被引
1
次
|
|
|
|
8.
Brandes U. A Faster Algorithm for Betweenness Centrality.
Journal of Mathematical Sociology,2001,25(2):163-177
|
CSCD被引
119
次
|
|
|
|
9.
何新贵. 中文文本的关键词自动抽取和模糊分类.
中文信息学报,1999,13(1):9-15
|
CSCD被引
16
次
|
|
|
|
|
|