突破传统局限:GNPS驱动天然产物暗物质发现和靶向分离
天然产物因其结构多样性、生物活性特异性,始终是新药研发的核心资源,统计数据显示近半数上市小分子药物源自天然产物及其衍生物。植物、微生物等天然资源中蕴含海量次生代谢产物,其中绝大多数成分因含量低微、结构未知、无标准对照品,无法通过传统色谱、质谱手段识别,被定义为天然产物暗物质,是新型活性先导化合物的重要潜在来源。
传统天然产物研究依赖反复柱层析分离、逐一结构鉴定的“先分离后鉴定”模式,存在明显技术短板:研发周期冗长、人力物力成本高昂,极易重复分离已知化合物,且微量新颖活性成分易在分离过程中丢失,无法实现对天然产物暗物质的有效挖掘。随着质谱技术的迭代,超高效液相色谱-串联质谱(UHPLC-QTOF)可实现复杂样品的全景物质检测,但海量质谱数据的解析难题成为制约天然产物挖掘的新瓶颈。
全球天然产物社交分子网络(GNPS, Global Natural Products Social Molecular Networking)是基于开源质谱数据的在线分析平台,核心原理是依托二级质谱碎片离子的相似性聚类,将结构相近的化合物聚合为分子网络簇,实现已知化合物快速注释、未知化合物快速筛查,彻底改变了传统天然产物的研究逻辑。通过“先预测、后分离”的靶向研究模式,GNPS可精准锁定天然产物中的暗物质与目标活性成分,极大提升天然产物分离纯化的针对性与高效性,目前已广泛应用于植物、微生物天然产物的新结构化合物挖掘、活性成分筛选和靶向分离研究。
图2 分子网络构建
GNPS技术的核心原理与优势
1
核心原理
GNPS技术的核心是MS/MS质谱相似性分子网络聚类。天然产物粗提物经LC-MS/MS检测后,可获得所有成分的二级质谱碎片信息,平台通过算法比对不同化合物的碎片离子图谱、质荷比、碎片匹配度,计算余弦相似度,将结构相似、骨架同源的化合物聚类为同一网络节点簇。同一聚类簇内的化合物具有相同或相似的母核结构,已知化合物可通过数据库比对快速注释,而簇中无匹配信息的独立节点、新型分支节点,即为潜在的天然产物暗物质(新结构化合物)。
同时,GNPS可结合样品分组信息,实现不同萃取部位、不同组分的化学成分差异分析,精准定位特异性代谢产物,为后续靶向分离提供明确目标,彻底解决传统研究“盲目分离、随机筛选”的痛点。
图3 经典分子网络聚类
图4 相似母核的已知化合物与暗物质
2
相较于传统技术的核心优势
破解暗物质挖掘难题。传统质谱仅能依托标准品匹配鉴定已知化合物,无法识别未知代谢产物;GNPS无需标准品,通过结构相似性聚类即可预判未知新化合物,激活天然产物中未被开发的暗物质资源。
实现去重与高效筛选。可快速区分已知化合物与潜在新化合物,避免重复分离已知成分,大幅降低研发成本。
精准靶向分离。可锁定目标活性聚类簇与特征节点,指导后续色谱分离纯化,实现从“盲目分离”到“精准靶向”的转变。
数据可共享、可溯源。开源数据库可实现全球质谱数据比对,提升化合物注释的准确性与全面性。
GNPS应用案例
米槁含氧桥倍半萜的暗物质挖掘与靶向分离[1]
米槁(Cinnamomum migao H. W. li)是贵州特色苗药,常用于心脑血管疾病的治疗,倍半萜类是其主要活性成分,具有神经保护、抗炎等药理活性。前期研究已发现米槁中存在青蒿素类倍半萜成分,但大量结构新颖的含氧桥倍半萜因含量低微、结构未知,属于典型的天然产物暗物质,难以通过传统方法挖掘。研究依托GNPS分子网络技术,实现米槁中新型含氧桥倍半萜的快速筛查与靶向分离,完整展现了GNPS从暗物质发掘到靶向分离的应用流程。
1
样品预处理与质谱数据采集
以米槁果实为原料,经乙醇回流提取获得粗提物,依次通过石油醚、乙酸乙酯萃取,得到活性富集的乙酸乙酯部位。对该部位进行硅胶柱层析梯度洗脱,分离得到4个亚组分(Fr.B1–Fr.B4)。为全面捕捉组分中的代谢产物信息,对所有亚组分进行UHPLC-ESI-QTOF-MS/MS全景检测,采集正负离子模式下的二级质谱数据,覆盖样品中所有极性、分子量的次生代谢产物,为后续GNPS分析提供完整数据基础。
图5 B1 组分的总离子流图
2
GNPS分子网络构建与天然产物暗物质筛查
将采集的LC-MS/MS原始数据通过ProteoWizard软件转换为mzXML通用格式,上传至GNPS平台构建分子网络。设置前体离子质量偏差2.0 Da、碎片离子偏差0.5 Da,筛选余弦相似度>0.7、匹配峰数>6的有效网络边,保证聚类结果的准确性,最终通过Cytoscape软件实现分子网络可视化分析。
研究以前期已鉴定的米槁倍半萜cinnamigones A–C为分子探针,靶向筛选结构相似的含氧桥倍半萜聚类簇。通过网络聚类分析发现,质谱m/z 237.177、233.153、235.677处存在多个特征节点,与已知倍半萜骨架相似度高,但无数据库匹配信息,判定为米槁中的天然产物暗物质,即为潜在的新型含氧桥倍半萜类似物。
图6 B1 组分中质荷比 237.18 母离子的提取离子流图
通过节点颜色、组分对应关系分析,明确了新型倍半萜的分布组分与质谱特征,快速锁定5个未被报道的新型倍半萜候选靶点,解决了传统方法无法识别微量新型同系物的难题,完成了从海量复杂成分中挖掘暗物质的核心步骤。
图7 利用 GNPS 平台构建贵州木姜子粗提物的分子网络,具有不同质荷比特征的节点代表对应母离子质量,节点颜色区分不同馏分。
3
基于GNPS结果的靶向分离纯化
传统分离模式需对所有组分逐一纯化、鉴定,工作量极大且易遗漏微量新化合物。基于GNPS分子网络的靶向定位结果,研究摒弃盲目分离思路,针对暗物质节点对应的特征组分、质谱参数,制定精准的分离方案,实现目标化合物的定向富集与纯化。
根据GNPS聚类结果,对含新型倍半萜的关键亚组分进行细分纯化:Fr.B1、Fr.B2、Fr.B4等核心活性组分采用半制备HPLC梯度洗脱,结合GNPS预判的保留时间、质谱特征,精准筛选目标色谱峰。最终成功分离得到5个未报道的新型含氧桥倍半萜(cinnamigones D–H)与3个已知倍半萜类似物,极大提升了分离效率与新化合物发现率。
图8 化合物 1~8 的结构式
4
新化合物结构鉴定与活性验证
对靶向分离得到的新型化合物,通过HRESIMS、单晶X射线衍射、ECD计算、1D/2D NMR等光谱技术完成结构解析。结果显示,所有新化合物均具有独特的含氧桥结构单元与三环骨架,其中cinnamigone E拥有罕见的6/7/6三环苯环体系,为天然产物中少见的特殊骨架结构,充分印证了GNPS对稀有暗物质成分的挖掘价值。
图9 化合物 1-5 的主要 NOESY 相关信号(紫色箭头)
采用NMDA诱导的PC12细胞神经损伤模型评价化合物活性,结果显示cinnamigone E、cinnamigone F具有显著的神经保护活性。分子对接实验进一步证实,两种活性化合物可通过氢键、疏水作用结合NMDA受体活性位点,明确了其作用机制,实现了“暗物质挖掘—靶向分离—活性验证”的完整研究闭环。
GNPS在天然产物研究中的应用价值
1
激活天然产物暗物质资源
天然产物中90%以上的次生代谢产物属于未被鉴定的暗物质,是新药先导化合物的核心储备资源。GNPS依托质谱相似性聚类,突破标准品依赖的鉴定局限,可高效筛查复杂提取物中的未知新骨架、新同系物、微量活性成分,极大拓展了天然产物的挖掘范围,激活了长期被忽视的暗物质资源。
2
革新天然产物分离研究模式
传统天然产物研究为“分离→鉴定→筛选”的被动模式,存在严重的盲目性。GNPS构建了“质谱全景检测→分子网络聚类→暗物质预判→靶向分离→活性验证”的主动研究新模式,从根源上规避已知化合物重复分离,大幅缩短研发周期、降低实验成本,实现天然产物研究的高效化、精准化。
3
助力活性先导化合物精准发现
GNPS可结合样品活性差异、组分特征,靶向关联化学结构与生物活性,精准定位具有药理活性的未知代谢产物。在抗菌、抗炎、神经保护、抗肿瘤等天然活性成分筛选中,可快速锁定目标活性簇,为创新药物研发提供高质量先导化合物,提升天然产物新药转化效率。
总结
GNPS分子网络技术彻底打破了传统天然产物研究的技术壁垒,成功解决了天然产物暗物质难以挖掘、活性成分分离盲目性强的行业痛点。大量实践证明,GNPS可高效实现复杂天然产物体系中未知成分的筛查、目标活性成分的靶向定位与精准分离,极大提升了新结构、高活性天然产物的发现效率。作为天然产物研究的核心新技术,GNPS为天然产物资源的深度开发、创新药物先导化合物的精准发掘提供了全新思路与技术路径。
成都普思生物拥有涵盖数千种天然产物单体的特色化合物库和安捷伦公司共建的天然产物质谱数据库,整合SIRIUS、GNPS、MS-DIAL等工具,实现多维数据挖掘与精准结构鉴定,深度融合多组学技术、人工智能预测、分子对接虚拟筛选;应用GNPS将实现“结构预判-活性预测-靶向分离-机制验证”的全流程智能化研究。公司可提供从复杂样品结构预判、基于分子网络活性预测、到靶向分离的全链条服务,为天然产物新药研发、中药物质基础研究、特色药用资源开发利用提供更高效的技术支撑。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com