帮助 关于我们

返回检索结果

面向公共安全事件的网络文本大数据结构化研究
Public Security Event Themed Web Text Structuring

查看参考文献61篇

裴韬 1,2,3   郭思慧 1,2   袁烨城 1 *   张雪英 4,3   袁文 1   高昂 5   赵志远 6   薛存金 7  
文摘 网络文本中所包含的相关信息目前已成为公共安全事件紧急救援与影响评估的重要信息源。现有的方法虽然可定向地提取文本信息中事件的各类要素信息,但由于缺乏面向事件的整体建模与解析框架,难以从网络文本中获取系统的事件要素的结构化信息,即所提取的事件要素信息要么不够完整,要么与目标事件不匹配,由此产生的遗漏与谬误难以支撑针对公共安全事件信息的系统分析。为解决该问题,本文提出了面向公共安全事件的网络文本大数据结构化理论框架,首先,建立了公共安全事件的语义框架,并以地震事件为例构建了相应的结构化表结构;其次,应用训练语料的关联标注解决了事件要素与事件无法匹配的难点;最后,通过使用可融合关联信息的文本解析算法,系统提取了事件类型、事件名称、事件时间、事件位置及其他属性,基本实现了网络文本中不同事件信息的结构化。本文以云南邵通鲁甸地震为例,展示了地震事件的网络文本信息的结构化过程与结果,为分析地震所受的关注程度以及救援状况提供了重要参考。在上述研究的基础上,开发了面向公共安全事件的网络文本信息挖掘系统,展示了地震事件文本的结构化解析以及由此实施的事件关注度分析。
其他语种文摘 The information of public security event contained in text can be the data source of the evaluation and the relief if it can be structured into a relational database.Although previous research can extract the information of events into different attributes,the determination on the attribution of the attribute information to specific event remains unsolved.To solve the problem,this paper proposes a theoretical frame of public security event themed web text structuring,which is composed of three parts.First,an event semantic model is used to construct the seismic event semantic framework which defines abstract elements of event and their semantic relationships.Taking seismicity as an example,spatial element,time element,attribute element,source element are defined as basic elements.Spatial element includes earthquake latitude,longitude,depth and location.Attribute element is further subdivided into four sub-elements:Cause,result,behavior and influence element.Next,an annotation system is applied to typical event materials to label semantic elements,e.g.the place name where an earthquake took place,that is,instantiation of the abstract elements.The key to this step is labeling the relations between elements and specific event.Finally,the event text is structured into event type,event name,event time,event location and other attributes by using the text information extraction algorithm.The algorithm used the labeled materials in the last step as training data to optimize parameters,which can incorporate linked information.The extracted event text (e.g.words,phrases) finally is normalized to structured information for further analysis.An event information mining platform following the whole frame is developed,which includes the modules of webpage searching,text cleaning,event information extraction,visualization and analyzing.The platform processed the whole Chinese webpages of 2014 and found 85 506 seismicity reports.Taking Yunnanludian earthquake as an example,we display the structuring process and result of related web text,which can be the important reference for the relief of the disaster and the analysis of public concern.With the platform,we can demonstrate the seismic text structuring result and its social concern across China,which can be a new tool of event information mining and analyzing.
来源 地球信息科学学报 ,2019,21(1):2-13 【核心库】
DOI 10.12082/dqxxkx.2019.180680
关键词 语义框架 ; 文本解析 ; 事件关注度 ; 地震事件 ; 空间搜索引擎
地址

1. 中国科学院地理科学与资源研究所, 资源与环境信息系统国家重点实验室, 北京, 100101  

2. 中国科学院大学, 北京, 100049  

3. 江苏省地理信息资源开发与利用协同创新中心, 江苏省地理信息资源开发与利用协同创新中心, 南京, 210023  

4. 南京师范大学, 虚拟地理环境教育部重点实验室, 南京, 210023  

5. 中国标准化研究院, 北京, 100088  

6. 武汉大学, 测绘遥感信息工程国家重点实验室, 武汉, 430079  

7. 中国科学院遥感与数字地球研究所, 北京, 100094

语种 中文
文献类型 研究性论文
ISSN 1560-8999
学科 自动化技术、计算机技术
基金 国家自然科学基金项目
文献收藏号 CSCD:6415535

参考文献 共 61 共4页

1.  ScienceChina 中国科学文献服务系统

您还没有权限

 


请您 返回ScienceChina—中国科学文献服务系统首页重新检索,如果您在使用ScienceChina—中国科学文献服务系统遇到问题。

销售咨询联系:

北京中科进出口有限责任公司

联系电话: (010) 84039345-635

电子邮件:chuw@bjzhongke.com.cn

联系地址:北京市东城区安定门外大街138号皇城国际大厦B座801 100011

服务咨询联系:

中国科学院文献情报中心

联系电话: (010) 82627496

传 真:(010) 82627496

电子邮件:cscd@mail.las.ac.cn

联系地址:北京市 海淀区 北四环西路33号 100190

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号