基于领域知识图谱的生命医学学科知识发现探析
Discovering Subject Knowledge in Life and Medical Sciences with Knowledge Graph
查看参考文献43篇
文摘
|
【目的】探讨融合多源数据,开展深层次学科知识发现研究与服务的方法。【方法】通过构建科技文献SPO语义网络形成领域知识图谱的核心;通过“实体对齐、概念层次融合与关系融合”实现多源异构数据融合,生成完整领域知识图谱;基于领域知识图谱开展深层次学科知识发现;选择造血干细胞癌症治疗进行实证研究。【结果】提出一套基于知识图谱的学科知识发现方法框架KGSKD,可多维度、细粒度融合多源异构数据,定义数据间复杂语义关系,原生支持知识推理、路径发现、链路预测等知识发现应用。【局限】KGSKD存在容易出现数据过饱和、知识发现过程可解释性较差、与领域专家沟通难度较高等局限。【结论】KGSKD具有数据类型更丰富、知识关联更全面、挖掘方法更先进、发现结果更深入等优势,可更有效地支持生命医学学科深层次知识发现研究与服务。 |
其他语种文摘
|
[Objective] This paper explores new methods for deep subject knowledge discovery using multi-source heterogeneous data. [Methods] First, we constructed a SPO semantic network of literature to create the core domain knowledge graph. Then, we implemented multi-source heterogeneous data fusion through“entity alignment, concept level fusion and relationship fusion”to obtain the whole domain knowledge graph. Finally, we discovered deep subject knowledge with the help of this knowledge graph. We examined our method with data on Hematopoietic Stem Cell for Cancer Treatment (HSCCT). [Results] This paper proposed a knowledge graph-based framework for subject knowledge discovery (KGSKD), which fuses multi-source heterogeneous data multi-dimensionally and fine-grainedly, enriches semantic relationships among data, and supports knowledge discovery techniques such as knowledge inference, pathfinder, and link prediction natively. [Limitations] KGSKD has some limitations including data supersaturation, poor interpretability of knowledge discovery results and difficulty in communicating with domain experts. [Conclusions] KGSKD has the advantages of“richer data types”,“more comprehensive knowledge linkage”,“more advanced mining methods”and“deeper discovery results”, which effectively supports research and services of deep knowledge discovery in life sciences and medicine. |
来源
|
数据分析与知识发现
,2020,4(11):1-14 【扩展库】
|
DOI
|
10.11925/infotech.2096-3467.2020.0681
|
关键词
|
学科知识发现
;
知识图谱
;
SPO三元组
;
数据融合
;
实体对齐
|
地址
|
1.
中国科学院成都文献情报中心, 成都, 610041
2.
中国科学院大学经济与管理学院图书情报与档案管理系, 北京, 100190
3.
广州市再生医学与健康广东省实验室, 广州市再生医学与健康广东省实验室, 广州, 510700
4.
中国科学院广州生物医药与健康研究院, 广州, 510530
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
2096-3467 |
学科
|
社会科学总论;自动化技术、计算机技术 |
基金
|
中国科学院“十三五”信息化专项
;
中国科学院文献情报能力建设专项
;
科技部创新方法工作专项
|
文献收藏号
|
CSCD:6853462
|
参考文献 共
43
共3页
|
1.
梁娜. 推进数据密集科学发现提升科技创新能力:新模式、新方法、新挑战-《第四范式:数据密集型科学发现》译著出版.
中国科学院院刊,2013,28(1):115-121
|
被引
3
次
|
|
|
|
2.
张志强. 干细胞领域知识发现大数据平台建设与应用.
中国科研信息化蓝皮书2020,2020
|
被引
1
次
|
|
|
|
3.
陆伟. 基于解剖结构视角的医学学科画像研究.
信息资源管理学报,2018,8(3):12-24
|
被引
1
次
|
|
|
|
4.
张志强. 论学科信息学的兴起与发展.
情报学报,2015,34(10):1011-1023
|
被引
8
次
|
|
|
|
5.
张志强. 面向精准医学知识发现的生物医学信息学发展.
数据分析与知识发现,2018,2(1):1-8
|
被引
3
次
|
|
|
|
6.
李广建. 论计算型情报分析.
中国图书馆学报,2018,44(2):4-16
|
被引
11
次
|
|
|
|
7.
李文林. 基于文献的知识发现服务及其问题-以南京中医药大学图书馆为例.
大学图书馆学报,2015,33(2):61-65
|
被引
2
次
|
|
|
|
8.
漆桂林. 知识图谱研究进展.
情报工程,2017,3(1):4-25
|
被引
71
次
|
|
|
|
9.
Hu Z Y. A Knowledge Graph of Stem Cell Oriented to Subject Knowledge Discovery.
Proceedings of the 7th IEEE International Conference on Healthcare Informatics,2019
|
被引
2
次
|
|
|
|
10.
Lamurias A. Generating a Tolerogenic Cell Therapy Knowledge Graph from Literature.
Frontiers in Immunology,2017,8:1-12
|
被引
3
次
|
|
|
|
11.
马明. Don R.Swanson 的情报学学术成就的方法论意义与启示.
情报学报,2003,22(3):259-266
|
被引
13
次
|
|
|
|
12.
胡正银. 面向TRIZ的领域专利技术挖掘系统设计与实践.
图书情报工作,2017,61(1):117-124
|
被引
3
次
|
|
|
|
13.
Swanson D R. Fish Oil, Raynaud's Syndrome, and Undiscovered Public Knowledge.
Perspectives in Biology and Medicine,1986,30(1):7-18
|
被引
25
次
|
|
|
|
14.
Swanson D R. Undiscovered Public Knowledge.
The Library Quarterly,1986,56(2):103-118
|
被引
11
次
|
|
|
|
15.
Smalheiser N R. Literature-Based Discovery: Beyond the ABCs.
Journal of the American Society for Information Science and Technology,2012,63(2):218-224
|
被引
3
次
|
|
|
|
16.
Henry S. Literature Based Discovery: Models, Methods, and Trends.
Journal of Biomedical Informatics,2017,74:20-32
|
被引
4
次
|
|
|
|
17.
Pyysalo S. LION LBD: A Literature-Based Discovery System for Cancer Biology.
Bioinformatics,2019,35(9):1553-1561
|
被引
5
次
|
|
|
|
18.
Kostoff R N. Literature-Related Discovery (LRD): Potential Treatments for Cataracts.
Technological Forecasting and Social Change,2008,75(2):215-225
|
被引
1
次
|
|
|
|
19.
Kostoff R N. Literature-Related Discovery (LRD): Potential Treatments for Multiple Sclerosis.
Technological Forecasting and Social Change,2008,75(2):239-255
|
被引
1
次
|
|
|
|
20.
Kostoff R N. Literature-Related Discovery (LRD): Potential Treatments for Parkinson's Disease.
Technological Forecasting and Social Change,2008,75(2):226-238
|
被引
1
次
|
|
|
|
|