Nat. Mach. Intell. | 小分子串联质谱谱图的预测

  • A+
分享一篇nature machine intelligence上的文章Tandem mass spectrum prediction for small molecules using graph transformers,本文通讯作者是来自多伦多大学的Bo Wang教授与Hannes Röst教授。其研究方向分别为机器学习、计算生物学、计算机视觉、用计算方法理解质谱数据


1
对于大部分分子,我们无法准确预测其在质谱仪中的碎裂模式。虽然理论上通过理论物理可以预测,但计算太过缓慢无法高通量进行,并且需要进行降低预测准确度的近似处理。从MS/MS数据中识别出化合物是代谢组学中一个重要问题,通常需要从大量参考库中通过相似性搜索出匹配的化合物,但现有的库中化合物太少,远远无法包含人类代谢物。一个可行的办法是同时匹配计算预测的谱图,以提高覆盖度。本文中发展了以图transformer为基础的算法MassFormer来预测化合物的二级谱图。
2
MassFormer将分子表示为图结构,每个节点包含原子及度信息,每个边表示化学键及最短距离信息。这些数据之后会经过多头自注意及多层感知机进行迭代处理学习。学习到的自注意权重表示节点之间的关联情况,并直接由边的信息所影响。几轮后会最终生成单个的embedding来表示整个分子。之后结合谱图的信息(如precursor离子化之后的加合物、仪器等),通过多层感知机生成一组正值的向量,其中每一个维度表示一个小范围的m/z,其数值表示了预测的峰的强度。
3
9
MassFormer预测出的分子的碎裂谱图与实际情况匹配得很好。作者将MassFormer与其他机器学习预测谱图的算法进行了比较,MassFormer取得了明显较好的预测准确度。MassFormer也可以很好预测不同碰撞能量时产生的谱图,与实际情况也符合得很好。
本文作者:JGG
责任编辑:ZF
文章链接:https://www.nature.com/articles/s42256-024-00816-8
文章引用:10.1038/s42256-024-00816-8



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0