• 首页
  • 感性生活,理性思考。


化合物信息数据库平台项目的研究分析

化合物信息数据库特性

化合物的二维和三维结构、SRN(化合物系统编号)、化合物的物化性质。用户通过全结构检索,子结构检索以及模糊结构检索可查出目标化合物的物化性质、二维和三维结构。

常用数据库

ZINCPubChemDrugBankChEMBL、ChemDB、HMDB、BindingDB、SMPDB、ChemSpider

更多平台可以:点击这里

技术核心与难度

  • 搜索引擎优化 [5星]
  • 大量数据中二叉树寻址 [4星]
  • 结构化数据 [3星] OK
  • 化合3D展示表达 [5星] OK

结构编辑器 [非必须]

内嵌自主研发的impDraw化学结构编辑器,可在系统内绘制及编辑化合物的结构或反应式。

查询功能 [必须]

支持子结构查询、精确结构查询和相似度查询,每秒可检索 20 万个化学结构。对sql查询性能优化、前端展示问题。

详细情况:点击这里

检索类型 [必须]

  • 化合物检索
  • 化合物结构检索
  • 化合物子结构检索
  • 化合物模糊结构检索
  • 化合物特征结构检索

3D模型展示 [必须]

案例使用的3维数据转换工具 - 点击这里
案例使用的是自主开发的PubChem 3D Viewer: 点击这里

文件格式有:.sdf .asnt .json .xml

  • .sdf三维格式数据展示

  • 半开源的[Web]端化学分子结构式查看/编辑工具 Molview $49/mouth GUN授权

利用html的canvas功能来展示三维模型。使用Three.js显示效果:详情点击这里

开源搜索引擎 [必须]

  • Sphinx
  • Lucene [OK]

目前主流的开源搜索引擎主要有两个,一个是基于Java的Apache Lucene,另一个是基于C++的Sphinx。在建立索引所需时间方面,Sphinx只需Lucene时间的50%左右,但是索引文件Sphinx比Lucene要大一倍,即Sphinx采用的是空间换时间的策略。在全文检索速度方面,二者相差不大。全文检索精确度方面,Lucene要优于Sphinx。另外,在加入中文分词引擎的难易程度上,Lucene要优于Sphinx。因此,在一般情况下,选择Lucene作为全文搜索引擎是比较好的选择。

本文链接:

https://chao.asia/tech/145.html

1 + 4 =
快来做第一个评论的人吧~
lamu.png