English
新闻公告
More
化学进展   后一篇

• 特约稿 •

Internet推动的化学信息学重要进展*

李晓霞** 郭力 袁小龙 夏诏杰 聂峰光   

  1. (中国科学院过程工程研究所多相复杂系统国家重点实验室 北京100190 )

  • 收稿日期:2008-10-08 修回日期:1900-01-01 出版日期:2008-12-24 发布日期:2008-12-25
  • 通讯作者: 李晓霞

Internet Motivated Progress in Chemoinformatics

Li Xiaoxia**; Guo Li; Yuan Xiaolong; Xia Zhaojie; Nie Fengguang

  

  1. (State Key Laboratory of Multiphase Complex Systems, Institute of Process Engineering, Chinese Academy of Sciences, Beijing 100190, China)

  • Received:2008-10-08 Revised:1900-01-01 Online:2008-12-24 Published:2008-12-25
  • Contact: Li Xiaoxia
Internet的普及为专业人员获取数据信息、利用计算工具提供了统一的平台,由此为化学信息学的发展带来了新的空间,推动了化学信息学以网络为基础,以化学相关的数据、信息及计算资源共享为目标的快速发展。本文将从不同侧面回顾近10年来化学信息学的重要进展, 包括:(1) 网络化学信息检索:索引对象从化学浅层网向化学深层网发展;检索工具从Web化学信息资源导航向化学专业搜索引擎(包括文本信息和化合物标识信息)、及化学深层网检索引擎 (化合物物性数据提取)发展;索引粒度从Web站点向页面、乃至页面中的特定内容发展,一般页面特定内容的数据提取(即非结构化数据提取)是未来发展的方向。(2)可共享的化学数据库:从可免费访问和使用的化学数据库向数据库内容通过集成多来源数据(包括数据库拥有者主动收集、多来源数据主动提交达到共享的方式,repository)实现数据库内容免费下载和共享,以及不同数据库之间的相关内容实现无缝连接的方向发展(如NIH建成的药物小分子共享数据库PubChem)。(3) 开源(open source)化学软件工具包:从化学结构基本处理模块如CDK、JOELib向集成开发环境如化学信息学与生物信息学集成环境Bioclipse发展。(4) 与化合物及其数据共享相关的推荐标准:包括用于共享数据交换的化学标记语言CML、IUPAC推荐的学术论文相关热力学实验数据提交标准ThermoML及化合物结构唯一描述码InChI。(5) 计算化学资源共享及基于网格的应用:从可执行程序的下载向在线计算、基于网格的应用发展。(6) eChemistry和虚拟研究环境:网络也成为化学相关日常的科学活动中不可缺少的平台。构建以网络为平台、支持开展科研活动的数字化基础设施和服务的eChemstry探索开始出现,根据需要自主集成多来源数据和计算资源,形成不同层次的支持协同工作的虚拟研究环境是未来数据和计算资源共享方式的发展方向。
As the major media, often the only source for chemical information, Internet provides both challenges and opportunities for chemoinformatics, which fosters the advancement of chemoinformatics to meet the ever increasing demands for sharing of chemical data and computational tools over Internet. This paper will review the progress of chemoinformatics motivated by Internet in the past 10 years. Firstly, Internet chemical information searching tools that started from index of text chemical information with web chemistry directory and chemistry search engines for Surface Web to index of chemicals for searching distributed chemical databases by multi-sources index deposit integration and Deep Web data extraction, further to index of physical and chemical property data by information extraction will be discussed. Other topics will cover standards for open access and data interchange among chemical databases and computational applications, computational chemistry resource sharing via online web services, open source packages for chemical information processing, and grid based applications, and efforts for eChemistry and virtual research environment that might be constructed by automated integration of data and computational resources on demand.

中图分类号: 

()
[1] 乔园园,鹿涛,车云霞. 化学信息学与生物信息学开放性比较[J]. 化学进展, 2007, 19(04): 624-632.