帮助 关于我们

返回检索结果

科技大数据知识图谱构建模型与方法研究
Building Knowledge Graph with Sci-Tech Big Data

查看参考文献15篇

王颖 1 *   钱力 1,2   谢靖 1,2   常志军 1,2   孔贝贝 1  
文摘 【目的】研究从科技大数据中提取结构化知识、构建学术知识网络的模型与方法,支持智能知识服务产品的研发提升精准知识发现能力。【方法】提出科技大数据知识图谱的构建模型和技术架构,在汇聚和融合科技大数据知识资源的基础上,以大数据平台分布式存储和高性能计算为支撑环境,详细设计和实现科研实体知识抽取、实体对齐和关系发现、知识融合与语义丰富化、语义化存储、质量管理等知识图谱构建技术。【结果】构建3亿实体和11亿关系的科技大数据知识图谱,有效支撑科技大数据知识发现平台和“慧科研”智能随身助手的服务。【局限】由于数据的规模和复杂性,知识图谱的质量管理仍需花费大量的人力,实体对齐的准确度也有待于提高。【结论】本文提出的知识图谱建设方案适用于科技大数据的知识管理和深加工,有助于科技知识的有效利用。
其他语种文摘 [Objective] This paper tries to extract information from Sci-Tech big data and build an academic knowledge network,aiming to develop smart knowledge services.[Methods] We proposed an Ontology schema and a framework to contruct knowledge graph based on the distributed storage and high-performance computing of big data platform.The proposed model helped us extract and align research entities for relationship discovery.We also adopted the knowledge merging and enrichment,semantic storage and quality management techniques.[Results] We created a huge knowledge graph including more than 300 million entities and 1.1 billion relations.It also supported knowledge discovery platform and smart personal research assistant apps for scientific big data.[Limitations] More research is needed to improve the quality management of knowledge graph,as well as the precision of entity alignment.[Conclusions] The proposed method improve the knowledge management of scientific and technology big data.
来源 数据分析与知识发现 ,2019,3(1):15-26 【扩展库】
DOI 10.11925/infotech.2096-3467.2018.1354
关键词 科技大数据 ; 知识图谱 ; 本体 ; 知识抽取
地址

1. 中国科学院文献情报中心, 北京, 100190  

2. 中国科学院大学图书情报与档案管理系, 北京, 100190

语种 中文
文献类型 研究性论文
ISSN 2096-3467
学科 社会科学总论;自动化技术、计算机技术
基金 国家社会科学基金青年项目
文献收藏号 CSCD:6552311

参考文献 共 15 共1页

1.  Singhal A. Introducing the Knowledge Graph: Things, Not Strings,2013 被引 2    
2.  Wu W. Probase: A Probabilistic Taxonomy for Text Understanding. Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data,2012:481-492 被引 14    
3.  . Baidu Open Knowledge Graph,2018 被引 1    
4.  张阔. 从搜索信息到搜索知识--技术架构,2013 被引 1    
5.  王元卓. OpenKN-网络大数据时代的知识计算引擎. 中国计算机学会通讯,2014,10(11):30-35 被引 2    
6.  Zhu J G. Software. Zhishi. Schema: A Software Programming Taxonomy Derived from Stackoverflow. Proceedings of the 14th International Semantic Web Conference (ISWC 2015),2015:1-4 被引 1    
7.  . Introduction to CN-Probase,2017 被引 1    
8.  国务院. 新一代人工智能发展规划,2017 被引 25    
9.  钱力. 基于科技大数据的智能知识服务体系研究设计. 数据分析与知识发现 被引 1    
10.  Springer Nature. SN SciGraph,2018 被引 2    
11.  Allen B P. The Roll of Metadata in the Second Machine Age,2017 被引 1    
12.  Taylor. Wizdom.ai,2018 被引 2    
13.  Tang J. AMiner: Extraction and Mining of Academic Social Networks. Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD'2008). Las Vegas, Nevada, USA,2008:990-998 被引 1    
14.  . Acemap Knowledge Graph,2018 被引 1    
15.  国家科技文献中心. NSTL统一文献元数据标准3.0,2017 被引 1    
引证文献 5

1 齐浩 地球科学知识图谱的构建与展望 高校地质学报,2020,26(1):2-10
被引 10

2 梁野 CLOpin:一种面向舆情分析与预警领域的跨语言知识图谱架构 数据分析与知识发现,2020,4(6):1-14
被引 0 次

显示所有5篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号