科研进展 | 浙江大学药学院团队发明基于线粒体表型的新药AI筛选技术发表时间:2024-09-06 14:55 近日,浙江大学药学院程翼宇/王毅团队联合美国斯坦福大学团队提出新型深度学习方法MitoReID用于自动学习细胞形态的大规模数据,通过构建全球首个药物作用下的细胞线粒体动态表型大规模数据集(逾 57万张单细胞形态图像),研究发现FDA批准已上市药物的靶点与线粒体表型具有相关性,由此可依据药物高内涵筛选图像推测出其作用靶标,实现了从细胞筛选模型智能辨识药靶的技术突破,进而发明了一种基于线粒体表型的新药AI筛选技术。相关研究成果发表在《自然》子刊《Nature Computational Science》(Nat Comput Sci, 2024, 4:600-614)。Nature 网站Drug Discovery专栏以“AI-Recognized Mitochondrial Phenotype Enables Identification of Drug Targets”为题对该论文进行了重点推荐和介绍(https://www.nature.com/subjects/drug-discovery)。在同期发表的Research Briefing中,资深编辑Kaitlin McCardle评价“该方法可通过更好地理解药物作用来改进药物设计”(This approach has the potential to improve drug design by enabling a better understanding of drug MOAs)。 图1 基于AI学习线粒体动态表型的新药MOA预测方法框架 药物靶标识别是新药发现的关键环节。尽管已有多种化学生物学方法用于解析活性化合物的作用机制(Mechanism of Action, MOA),但目前仍缺乏大规模靶标识别的低成本简便方法。近年来,基于图像的表型分析方法逐渐兴起,期望通过提取生物图像中的有用信息识别药物靶标。然而,面对细胞形态及亚细胞结构的时——空细微变化,如何有效抽取高通量筛选数据集中的多维特征仍存在巨大的技术挑战。为此,研究团队基于行人重识别(Person Re-identification, ReID)算法开发了针对线粒体动态表型识别的MitoReID方法,自动提取单个细胞线粒体在时序变化过程中的鲁棒性图像特征,通过大规模自监督预训练和时间维度增强等手段预测未知化合物的潜在靶标,为基于大规模细胞表型数据的新药AI筛选及老药新用提供了全新工具。 团队首先用绿色荧光蛋白标记H9c2心肌细胞线粒体,建立针对线粒体形态、膜电位的高内涵筛选方法(图2);通过采集1000余种FDA批准已上市药物作用后的线粒体表型时序图像,构建了细胞线粒体动态表型大规模数据集。所建立的MitoReID深度学习模型采用重识别框架,通过时间维度增强方法进行自监督预训练,随后在涵盖30余种不同类别作用机制的药物——靶标数据集上进行微调,可通过查询匹配新药与训练集中已知靶标药物的特征相似性来智能推断潜在作用靶标。 图2 线粒体形态、膜电位等多维特征表征方法及其时序变化 实验结果显示,MitoReID在测试集中的表现优于传统机器学习算法,达到了76.3%的rank-1准确率和65.9%均值平均精度(mAP)。此外,MitoReID成功识别了6种未包含在训练集中的“新药”作用靶标。该模型也被推广用于中药药效物质发现,预测来源于黄芩汤等中药复方/药材中60种重要活性成分的潜在作用靶标,发现天然黄烷醇化合物——表儿茶素可能具有抑制环氧合酶(Cyclooxygenase,COX)作用,体外实验进一步验证表儿茶素能直接与COX-2蛋白结合,并显著抑制COX-2活性。 该研究表明,通过AI技术分析药物对细胞线粒体形态的动态影响,可增进对候选新药作用机制的认识,也能够以更低成本发现中药活性成分的潜在靶标。这一方法为整合多模态表型组数据用于药物发现提供了新思路,不仅为老药新用提供了重要的技术支持,也为应用AI技术加速科学发现提供了新范例。相关方法已获得国家发明专利授权(ZL202310521452.3)。 论文第一作者为浙江大学药学院博士研究生余敏和之江实验室李炜铭,通讯作者为浙江大学药学院王毅教授、程翼宇教授和斯坦福大学Zhang Xingcai博士。该研究得到国家重点研发计划、国家自然科学基金、浙江省重点研发攻关计划等项目资助。 |