帮助 关于我们

返回检索结果

基于项权值排序挖掘的跨语言查询扩展
Cross Language Query Expansion Based on Item Weight Sorting Mining

查看参考文献16篇

黄名选 1,2,3   蒋曹清 3  
文摘 为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能.
其他语种文摘 To ameliorate the long-standing problems of theme drift and word mismatch in natural language processing applications,this paper first proposes a computing method for weighted itemset support and a pruning method based on item weight sorting(IWS).And then,a weighted association rule mining algorithm for query expansion is presented based on the IWS,and the models such as association rule antecedent and consequent hybrid expansion(RACHE),rule consequent expansion(RCE)along with rule antecedent expansion(RAE)are discussed.Finally,an algorithm of cross-language query expansion(CLQE)is put forward based on the IWS mining.The algorithm utilized the new support and the pruning method to mine the weighted association rules,and extracted high quality expansion terms from the rules according to the expansion models in order to carry out CLQE.A comparison between the proposed expansion algorithm and the existing CLQE algorithms based on weighted association rules mining is made,which shows that the former can effectively restrain the problems of query topic drift and word mismatch,and can be used in information retrieval in various languages to improve retrieval performance.The RCE achieves the optimal retrieval performance in the proposed expansion models,and the retrieval performance of the RACHE is not as good as that of the RAE and the RCE.The support is more effective for the RCE algorithm.The confidence can make the RAE and the RACHE get the best retrieval result.And moreover,the proposed mining method can be used in text mining,business data mining and recommendation system to improve its mining performance.
来源 电子学报 ,2020,48(3):568-576 【核心库】
DOI 10.3969/j.issn.0372-2112.2020.03.021
关键词 自然语言处理 ; 文本挖掘 ; 信息检索 ; 跨语言检索 ; 查询扩展 ; 推荐系统
地址

1. 广西财经学院, 广西跨境电商智能信息处理重点实验室, 广西, 南宁, 530003  

2. 广西财经学院广西(东盟)财经研究中心, 广西, 南宁, 530003  

3. 广西财经学院信息与统计学院, 广西, 南宁, 530003

语种 中文
文献类型 研究性论文
ISSN 0372-2112
学科 自动化技术、计算机技术
基金 国家自然科学基金 ;  广西应用经济学一流学科(培育)开放性课题 ;  广西(东盟)财经研究中心开放性课题
文献收藏号 CSCD:6770104

参考文献 共 16 共1页

1.  Ballesteros L. Phrasal translation and query expansion techniques for c ross-language information retrieval. Proceedings of the 20th Annual Interna tional ACM SIGIR Conference on Research and Development in Information Retrieval,1997:84-91 CSCD被引 1    
2.  吴丹. 基于伪相关反馈的跨语言查询扩展. 情报学报,2010,29(2):232-239 CSCD被引 10    
3.  Gaillard B. Query expansion for cross language info rmation retrieval improvement. Proceedings of the Fourth IEEE International Conference on Research Challenges in Information Science,2010:337-342 CSCD被引 2    
4.  魏露. 跨语言查询扩展优化. 计算机工程与设计,2014,35(8):2785-2803 CSCD被引 8    
5.  Cao G. Extending query translation to cross-language query e xpansion with Markov chain models. Proceedings of the Sixteenth ACM Conferenc e on Conference on Information and Knowledge Management,2007:351-360 CSCD被引 1    
6.  Agrawal A. Improving performance of Hindi-English based cross lang uage information retrieval using selective documents technique and query expansi on. International Journal of Science and Research,2016,5(5):1964-1967 CSCD被引 5    
7.  Tang P. A method of Chinese and Thai cross-lingual query expans ion based on comparable corpus. Journal of Information Processing Systems,2017,13(4):805-817 CSCD被引 2    
8.  Geraldo A P. UFRGS@CLEF2008:using association rules for cross-langua ge information retrieval. Proceedings of the 9th Cross-Language Evaluation Forum Conference on Evaluating Systems for Multilingual and Multimodal Informati on Access,2009:66-74 CSCD被引 1    
9.  黄名选. 完全加权模式挖掘与相关反馈融合旳印尼汉跨语言查询扩展. 小型微型计算机系统,2017,38(8):1783-1791 CSCD被引 11    
10.  黄名选. 基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展. 电子学报,2018,46(12):3029-3036 CSCD被引 8    
11.  黄名选. 基于加权关联模式挖掘的越英跨语言查询扩展. 情报学报,2017,36(3):307-318 CSCD被引 10    
12.  黄名选. 基于矩阵加权关联规则的跨语言查询译后扩展. 模式识别与人工智能,2018,31(10):887-898 CSCD被引 5    
13.  黄名选. 基于矩阵加权关联模式的印尼中跨语言信息检索模型. 数据分析与知识发现,2017(1):26-36 CSCD被引 4    
14.  周秀梅. 有效的矩阵加权正负关联规则挖掘算法--MWARM-SRCCCI. 计算机应用,2015,34(10):2820-2826 CSCD被引 2    
15.  Salton G. Term-weighting approaches in automatic text retrieval. I nformation Processing & Management,1988,24(5):513-523 CSCD被引 331    
16.  周秀梅. 基于项权值变化的完全加权正负关联规则挖掘. 电子学报,2015,43(8):1545-1554 CSCD被引 9    
引证文献 4

1 黄名选 融合Copulas理论和关联规则挖掘的查询扩展 模式识别与人工智能,2021,34(2):176-187
CSCD被引 0 次

2 黄名选 关联模式挖掘与词向量学习融合的伪相关反馈查询扩展 电子学报,2021,49(7):1305-1313
CSCD被引 1

显示所有4篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号