当前位置: 首页 > news >正文

开源、网页端、集成式小分子质谱鉴定

摘要

高分辨质谱(HRMS)是依托质谱图谱与大型化学数据库比对、实现小分子化合物去重的核心技术。但现有多数化学数据库对质谱数据处理、质荷比定向检索的支撑能力不足,难以满足化合物快速鉴定的需求。针对该问题,本研究搭建了整合型数据库OctoChemDB,该平台汇聚并标准化处理了PubChem、MassBank、GNPS等多个开源资源库的化学、生物及质谱图谱数据。本研究配套开发了表述性状态转移应用程序接口(REST API),支持外部工具与软件通过自定义参数对数据库进行程序化检索,也是研发人员将OctoChemDB数据接入自有分析流程与应用程序的核心入口。基于该接口,本团队搭建了网页应用,用户可依托该平台开展质荷比检索、分子式预测、同位素相似度评估、碎裂规律分析,同时获取相关文献与专利信息。该网页端直观展示了底层数据库与接口的实际应用效果,可显著提升小分子鉴定效率。本文通过3,4-亚甲二氧基甲基苯丙胺(MDMA)、咖啡因2个研究案例验证平台实用性,结果表明该平台可有效推导化合物结构假设、完成实验图谱与数据库标准图谱的匹配,并简化化合物去重分析流程。本项目所有内容(含源代码)均已开源,项目地址

https://github.com/cheminfo/octochemdb

访问地址

https://octochemdb.cheminfo.org/

luc.patiny@epfl.ch

#高分辨质谱 #小分子鉴定 #整合数据库 #REST接口 #化合物去重 #质谱图谱 #数据聚合

结果与讨论

开源数据库遴选

表1开源数据库整合概况

本表汇总了所选开源数据库信息,列明各数据库的入库条目数量及最新文献来源

开源数据库的同步与数据聚合

图1数据同步与聚合流程

数据同步阶段,插件每24小时自动检测外部数据库更新;下载更新数据后,通过「无立体异构-互变异构体统一标识(NoStereoTautomerID)」完成数据标准化。数据聚合阶段,将各类数据条目关联并整合为统一数据文档,同时参照美国国家生物技术信息中心(NCBI)标准完成物种分类数据归一化。整合后的数据库配套REST接口,可检索获取分子式、单同位素质量、专利、PubMed文献摘要等相关数据。

API检索与网页应用界面概述

图2 OctoChemDB首页界面——质谱数据处理入口

(1) 用户首先导入质谱图谱;

(2) 选取对应分子离子的单同位素质量;

(3) 系统根据用户自定义参数(元素范围、电离方式、质量精度)开展计算;

(4) 最终输出候选分子式列表。问号图标为用户帮助菜单;

(5) 点击问号按钮可直接查看平台使用说明文档;

(6) 结果导出功能支持将数据保存为JSON文件,或复制为制表符分隔表格,适配各类表格软件。

图3 OctoChemDB质谱库检索界面——基于碎裂规律拓展碎片离子分析

(1) 用户选取特征碎片峰;

(2) 设置质量精度、峰数量等参数;

(3) 点击按钮启动数据库检索;

(4) 检索结果按余弦相似度排序,可据此识别结构相似化合物的2级质谱图谱。

图4 OctoChemDB文献检索界面——检索PubChem中目标分子式对应的天然产物与生物活性化合物

(1) 选中化合物结构后,文献面板自动调取关联数据;

(2) 可查看该化合物的立体异构体与互变异构体;

(3) 点击链接可直接查阅PubMed文献摘要;

(4) 检索范围包含PubMed摘要、专利与生物活性实验数据。绿色数字代表单篇文献中涉及的化合物数量,便于用户筛选目标化合物相关度更高的文献。

详细总结

思维导图

数据源整合与数据规模

OctoChemDB整合了10个国际主流开放数据库,覆盖化学结构、质谱图谱、文献、专利、生物活性、物种分类6大类数据,2025年9月入库总条目规模:

参考

Anal Chem. 2026 Mar 3;98(8):6102-6108. doi: 10.1021/acs.analchem.5c06761.

OctoChemDB: An Aggregated Database for Small Molecule Identification Using High-Resolution MS Data

260216OctoChemDB.pdf

注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。

http://www.cnnetsun.cn/news/2888056.html

相关文章:

  • WechatDecrypt技术解析:微信数据库解密实现原理与深度指南
  • PowerPC 604e微架构解析:超标量、乱序执行与缓存一致性设计
  • 【小白也能轻松用】OpenClaw 一键部署保姆级攻略,零基础轻松玩转 AI(含最新安装包)
  • VC6/VC8开发的《重装机兵》FC复刻版:带DirectX9渲染与完整模块化C++源码
  • 逆向分析实战:用CE和OD一步步找到《魔域》老端魔石商店的购买Call与物品遍历公式
  • MFC DLL开发实战包:从VC6到VS2017全版本可编译的隐式调用工程
  • 最全 PS 放大缩小操作快捷键 附实用使用技巧
  • 把Google Colab当远程GPU工作站来用:持久化、可复现、自动化
  • MuleSoft+LLM企业级AI编排:构建可审计、可追溯、可落地的智能工作流
  • 终极解决方案:如何3步破解百度网盘提取码获取难题
  • 遗传算法进阶:从早熟收敛到生产级落地的实战指南
  • PotPlayer字幕翻译插件完全教程:免费实现外挂字幕实时翻译的终极方案
  • NSK W1202MA微型超高精度滚珠丝杠详解
  • 保姆级教程:用PyTorch FSDP和DeepSpeed ZeRO-3搞定单机多卡大模型训练(附代码)
  • 【MATLAB代码】二维A*(A star)+APF(人工势场法)路径规划与AOA-TDOA融合定位算法
  • 从福尔摩斯到CTF:用Python脚本快速统计高频词,搞定那道“浪里淘沙”题
  • GitHub驱动的数据科学工作流实战指南
  • 《怪诞谷》节目:探讨SpaceX上市、苹果Siri改造及Meta面部识别移除等热点
  • CTFshow PWN实战:从pwn24到pwn25,手把手教你两种栈溢出攻击姿势(含LibcSearcher避坑指南)
  • 阿里千问免费开放志愿填报Agent,家长为何仍疯抢万元付费咨询?
  • JetBrains IDE试用期重置终极指南:2026年最完整的开源解决方案
  • 别再死记硬背了!一张图看懂UDS诊断会话(10服务)与ECU权限的“父子关系”
  • 排序(4)-归并排序专题——归并排序的分治美学
  • 保姆级教程:手把手教你用ABAP查询T001B表,精准判断日期是否在OB52财务账期内
  • 从SPI Mode0/3时序图到PCB走线:高频SPI稳定性的‘隐形杀手’与避坑指南
  • vLLM 云原生推理基础设施深度解析:从 PagedAttention 内核到 Kubernetes 生产级部署
  • 别再只防外网了!用DHCP Snooping+IPSG给你的内网接入层加把‘锁’
  • 别再只点灯了!树莓派Pico的PWM信号详解:如何精准控制舵机角度与速度
  • DFT面积与性能的权衡:手把手教你根据项目需求选择Shared还是Dedicated Wrapper Cell
  • 避坑指南:若依多用户登录中Spring Security的Bean冲突与权限隔离陷阱