帮助 关于我们

返回检索结果

基于SVM区域构造的复杂中文版面分析
Complex Chinese Document Layout Analysis Based on SVM Region Formation

查看参考文献6篇

文摘 针对现有的版面分析算法对参数的敏感性以及弱适用性等缺陷, 提出基于SVM区域构造的复杂中文文档版面分析算法. 该算法通过选取最能代表区域字符特征的连通区(种子连通区)作为测试的第一特征, 利用具有强学习和泛化能力的支持向量机实现区域构造, 在构造的区域中运用投影快速判断文档阅读顺序. 实验结果表明, 该方法具有更好的适应性, 对复杂的中文版面有满意的分析结果
其他语种文摘 Most existing algorithms for document layout analysis are sensitive to the parameters and have weak applicability.In order to make up these deficiencies, this paper presents an algorithm of region formation based on Support Vector Machine(SVM)for analyzing Chinese document.In the proposed technique, it selects connected components called seed connected components which can be used to represent regions as the first feature for training.SVM is employed to form region since it has strong learning and generalization ability. The technique decides the reading order by exploiting the projection method. Extensive experimental results show that the proposed algorithm is more effective to analyze different kinds of document layout than the state-of-the-art methods
来源 计算机工程 ,2010,36(12):200-203 【核心库】
关键词 种子连通区 ; 支持向量机 ; 区域构造 ; 投影
地址

苏州大学计算机科学与技术学院, 苏州, 215006

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 电子技术、通信技术
基金 国家自然科学基金资助项目 ;  国家教育部科学技术研究重点项目 ;  江苏省高校自然科学基金
文献收藏号 CSCD:3934927

参考文献 共 6 共1页

1.  陈明. 多层次可信度指导下的自底向上的版面分析算法. 模式识别与人工智能,2003,16(2):198-203 被引 3    
2.  Breuel T M. The OCRopus Open Source OCR System,2007 被引 1    
3.  Xi Jie. Page Segmentation of Chinese Newspapers. Pattern Recognition,2002,35(12):2695-2704 被引 3    
4.  Chang Fu. Chinese Document Layout Analysis Using an Adaptive Regrouping Strategy. Pattern Recognition,2005,38(2):261-271 被引 2    
5.  Wu C C. A Machine-learning Approach for Analyzing Document Layout Structures with Two Reading Orders. Pattern Recognition,2008,41(10):3200-3213 被引 1    
6.  边肇祺. 模式识别,2000 被引 393    
引证文献 1

1 郭晓宇 基于连通区域的传真图像版面分割与分类算法 计算机应用研究,2012,29(8):3198-3200
被引 1

显示所有1篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号