科技大数据知识图谱构建模型与方法研究
Building Knowledge Graph with Sci-Tech Big Data
查看参考文献15篇
文摘
|
【目的】研究从科技大数据中提取结构化知识、构建学术知识网络的模型与方法,支持智能知识服务产品的研发提升精准知识发现能力。【方法】提出科技大数据知识图谱的构建模型和技术架构,在汇聚和融合科技大数据知识资源的基础上,以大数据平台分布式存储和高性能计算为支撑环境,详细设计和实现科研实体知识抽取、实体对齐和关系发现、知识融合与语义丰富化、语义化存储、质量管理等知识图谱构建技术。【结果】构建3亿实体和11亿关系的科技大数据知识图谱,有效支撑科技大数据知识发现平台和“慧科研”智能随身助手的服务。【局限】由于数据的规模和复杂性,知识图谱的质量管理仍需花费大量的人力,实体对齐的准确度也有待于提高。【结论】本文提出的知识图谱建设方案适用于科技大数据的知识管理和深加工,有助于科技知识的有效利用。 |
其他语种文摘
|
[Objective] This paper tries to extract information from Sci-Tech big data and build an academic knowledge network,aiming to develop smart knowledge services.[Methods] We proposed an Ontology schema and a framework to contruct knowledge graph based on the distributed storage and high-performance computing of big data platform.The proposed model helped us extract and align research entities for relationship discovery.We also adopted the knowledge merging and enrichment,semantic storage and quality management techniques.[Results] We created a huge knowledge graph including more than 300 million entities and 1.1 billion relations.It also supported knowledge discovery platform and smart personal research assistant apps for scientific big data.[Limitations] More research is needed to improve the quality management of knowledge graph,as well as the precision of entity alignment.[Conclusions] The proposed method improve the knowledge management of scientific and technology big data. |
来源
|
数据分析与知识发现
,2019,3(1):15-26 【扩展库】
|
DOI
|
10.11925/infotech.2096-3467.2018.1354
|
关键词
|
科技大数据
;
知识图谱
;
本体
;
知识抽取
|
地址
|
1.
中国科学院文献情报中心, 北京, 100190
2.
中国科学院大学图书情报与档案管理系, 北京, 100190
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
2096-3467 |
学科
|
社会科学总论;自动化技术、计算机技术 |
基金
|
国家社会科学基金青年项目
|
文献收藏号
|
CSCD:6552311
|
参考文献 共
15
共1页
|
1.
Singhal A.
Introducing the Knowledge Graph: Things, Not Strings,2013
|
被引
2
次
|
|
|
|
2.
Wu W. Probase: A Probabilistic Taxonomy for Text Understanding.
Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data,2012:481-492
|
被引
14
次
|
|
|
|
3.
.
Baidu Open Knowledge Graph,2018
|
被引
1
次
|
|
|
|
4.
张阔.
从搜索信息到搜索知识--技术架构,2013
|
被引
1
次
|
|
|
|
5.
王元卓. OpenKN-网络大数据时代的知识计算引擎.
中国计算机学会通讯,2014,10(11):30-35
|
被引
2
次
|
|
|
|
6.
Zhu J G. Software. Zhishi. Schema: A Software Programming Taxonomy Derived from Stackoverflow.
Proceedings of the 14th International Semantic Web Conference (ISWC 2015),2015:1-4
|
被引
1
次
|
|
|
|
7.
.
Introduction to CN-Probase,2017
|
被引
1
次
|
|
|
|
8.
国务院.
新一代人工智能发展规划,2017
|
被引
25
次
|
|
|
|
9.
钱力. 基于科技大数据的智能知识服务体系研究设计.
数据分析与知识发现
|
被引
1
次
|
|
|
|
10.
Springer Nature.
SN SciGraph,2018
|
被引
2
次
|
|
|
|
11.
Allen B P.
The Roll of Metadata in the Second Machine Age,2017
|
被引
1
次
|
|
|
|
12.
Taylor.
Wizdom.ai,2018
|
被引
2
次
|
|
|
|
13.
Tang J. AMiner: Extraction and Mining of Academic Social Networks.
Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD'2008). Las Vegas, Nevada, USA,2008:990-998
|
被引
1
次
|
|
|
|
14.
.
Acemap Knowledge Graph,2018
|
被引
1
次
|
|
|
|
15.
国家科技文献中心.
NSTL统一文献元数据标准3.0,2017
|
被引
1
次
|
|
|
|
|