文摘
|
国际上称之为材料安全数据表的MSDS是一份关于化合物安全信息的综合性法律文件.随着人们安全意识的提高以及对职业健康、环境保护等认识的不断深入,MSDS作为一个安全信息文件越来越受重视.由于制作MSDS需要一定的成本,充分利用网络上免费的MSDS数据对于了解化合物的安全信息具有重要的参考价值.已有针对MSDS的搜索工具,一般只能检索单一来源的MSDS数据库,所以建立一个能通过一个查询同时榆索多个来源数据库的MSDS搜索引擎,将为使用MSDS的人员提供极大方便.本文提出建立MSDS统一搜索引擎的框架,通过链接分析技术和深层网数据检索技术获取MSDS文件,然后缓存各数据源检索结果,并建立化合物索引以提高MSDS搜索引擎的响应速度.其实现过程包括发现与自动构造检索式模式、自动获取检索结果页面、利用数据提取的方法获取化合物标识信息以建立MSDS的化合物索引等多个方面,为建立一个可用的MSDS统一搜索引擎奠定坚实基础. |
其他语种文摘
|
The Material Safety Data Sheet internationally known as MSDS is a comprehensive legal document about compound's safety information. With better safety awareness and understanding of occupational health and environmental protection, MSDS as a safety information document is receiving increasing attention. Due to the costs for producing MSDS documents, the free MSDS documents on Internet are valuable references both for chemists and chemical suppliers. At present, the MSDS searching tools usually can only search single-source MSDS database. So to establish a MSDS search engine which could search in multiple-source MSDS databases through only one query at a time will facilitate MSDS searching on Internet. This article progresses a framework to establish a MSDS unified search engine, retrieves MSDS documents by link analysis and searching in deep web, then caches the searching results and establishes compound index to improve the speed of MSDS search engine. Its implementation process includes finding and generating the retrieval mode automatically, retrieving searching results page automatically, obtaining identification data of compounds by data extraction methods which can index MSDS documents, and so on, this can hopefully lead to a practical search engine for MSDS. |
来源
|
计算机与应用化学
,2009,26(6):828-832 【核心库】
|
关键词
|
MSDS
;
搜索引擎
;
网络爬行
;
深层网检索
;
数据提取
|
地址
|
中国科学院过程工程研究所, 多相复杂系统国家重点实验室, 北京, 100190
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1001-4160 |
学科
|
化学;环境科学基础理论 |
基金
|
国家自然科学基金
|
文献收藏号
|
CSCD:3602784
|
|
1.
.
MSDS
|
被引
1
次
|
|
|
|
2.
.
MSDS importance
|
被引
1
次
|
|
|
|
3.
.
MSDS history
|
被引
1
次
|
|
|
|
4.
.
Fisher Scientific
|
被引
2
次
|
|
|
|
5.
.
ChemExper
|
被引
1
次
|
|
|
|
6.
mallinckrodt baker.
mallinckrodt baker
|
被引
1
次
|
|
|
|
7.
.
MSDS Search
|
被引
1
次
|
|
|
|
8.
.
http://www.vwrsp.com
|
被引
1
次
|
|
|
|
9.
.
Beijing Research Institute of Chemical Industry
|
被引
1
次
|
|
|
|
10.
.
Institute of Progress Engineering Chemical database
|
被引
1
次
|
|
|
|
11.
.
Anquan site
|
被引
1
次
|
|
|
|
12.
ILO.
http://www.ilo.org/publie/english/protection/safewerk/cis/products/icsc/dtasht/index,htm
|
被引
1
次
|
|
|
|
13.
.
http://www,regexlab,com/zh/regrof,htm
|
被引
1
次
|
|
|
|
14.
.
http://www.pdfbox,org
|
被引
1
次
|
|
|
|
15.
卓流艺. XML技术在化学深层网数据提取中的应用.
计算机与应用化学,2006,23(11):1137-1141
|
被引
8
次
|
|
|
|
16.
储春梅. 定向查询引擎在Web化学数据库集成检索中的应用.
计算机与应用化学,2005,22(8):659-666
|
被引
9
次
|
|
|
|
17.
李晓霞. Internet化学信息的系统挖掘工具.
计算机与应用化学,2008,25(9):1079-1082
|
被引
5
次
|
|
|