Research on metadata storage and querying of FITS file based on NoSQL


刘应波 1   王锋 1   季凯帆 2   邓辉 2   戴伟 1   梁波 2  
文摘 随着大型天文望远镜的投入使用,观测台站正面临PB量级的海量数据存储、快速检索难题;同时由于在数据检索中起着关键作用的FITS文件头的可变性,导致难以使用传统的关系型数据库来建立可适应这种变化需求的非结构化数据模型。针对这个难题,提出了使用NoSQL对天文上广泛使用的FITS文件头中所包含的可变元数据信息进行存储和查询;讨论了关系型数据模型存储可变FITS文件头的不足;分析了NoSQL存储可变FITS头元数据信息的可行性;使用形式化的关系型代数对这种存储查询方式进行了一般化的讨论。通过具体查询实例验证了该方案在存储天文可变FITS文件头的有效性和可行性。
其他语种文摘 With a large telescope in use,observing stations are facing problems of PB-level data storage and data retrieval.Because of the variability of the FITS file header,it is difficult to utilize the traditional relational database to store and retrieve the unstructured data efficiently.To address these problems,this paper proposed using NoSQL to store and query the metadata of the FITS file header.It discussed the shortcomings of using relational data model to store the variable header of a FITS file.It described the process of data storage and query,analyzed the feasibility of using NoSQL to store the variable FITS header,and further employed the method of relational algebra to express the process formally.A specific query instance proves the effectiveness and feasibility of using NoSQL to store the variable astronomical FITS header.
来源 计算机应用研究 ,2015,32(2):461-465 【扩展库】
关键词 天文数据存储 ; 元数据 ; 海量数据查询 ; 非关系型数据库

1. 中国科学院云南天文台, 云南省计算机技术应用重点实验室, 昆明, 650011  

2. 昆明理工大学, 云南省计算机技术应用重点实验室, 昆明, 650500

语种 中文
文献类型 研究性论文
ISSN 1001-3695
学科 自动化技术、计算机技术
基金 国家自然科学基金-联合基金资助项目 ;  国家自然科学基金资助项目 ;  云南省应用基础研究计划重点项目
文献收藏号 CSCD:5349740

