
当你服药时,你想确切地知道它的作用。制药公司会通过大量的测试来确保你这样做。
莱斯大学布朗工程学院(Rice University’s Brown School of Engineering)发明了一种基于深度学习的新技术,他们可能很快就能更好地掌握正在开发的药物在人体中的表现。
莱斯大学计算机科学家Lydia Kavraki的实验室推出了代谢物翻译器,这是一种预测代谢物的计算工具,代谢物是药物和酶等小分子之间相互作用的产物。
莱斯大学的研究人员利用深度学习方法和大量反应数据集的可用性,为开发人员提供了一种药物作用的广泛图景。这种方法不受公司用来确定代谢反应的规则的约束,为新发现开辟了一条道路。
该研究由Kavraki、主要作者、研究生Eleni Litsa和莱斯大学校友、IBM Thomas J. Watson研究中心的Payel Das共同完成,发表在《皇家化学学会》杂志上
研究人员训练了代谢物翻译器,让它通过任何酶来预测代谢物,但根据现有的基于规则的方法来衡量它的成功程度,这些方法主要关注肝脏中的酶。这些酶负责解毒和消除外来生物,如药物、杀虫剂和污染物。然而,代谢物也可以通过其他酶形成。
“我们的身体是化学反应的网络,”Litsa说。“它们体内的酶对化学物质起作用,可能会破坏或形成键,从而改变它们的结构,形成可能有毒的东西,或导致其他并发症。现有的方法主要关注肝脏,因为大多数的异种化合物都是在肝脏代谢的。通过我们的工作,我们试图捕捉人类的新陈代谢。
Litsa说:“药物的安全性不仅取决于药物本身,还取决于药物在体内加工时可能形成的代谢物。”
她说,对结构化数据(如化学分子)进行操作的机器学习架构的兴起,使这项工作成为可能。Transformer是2017年推出的一种序列翻译方法,在语言翻译中得到了广泛的应用。
metabolite Translator基于SMILES(“简化分子输入行输入系统”),这是一种使用纯文本而不是图表来表示化学分子的标记方法。
“我们所做的和把一门语言翻译成德语完全一样,”Litsa说。
由于缺乏实验数据,本实验室采用迁移学习的方法开发了metabolite Translator。他们首先用90万种已知的化学反应对Transformer模型进行预训练,然后用人体代谢转化的数据对其进行微调。
研究人员通过分析65种药物和179种代谢酶的已知smile序列,将代谢物Translator的结果与其他几种预测技术的结果进行了比较。尽管metabolite Translator是在一个非特定于药物的通用数据集上进行训练的,但它的表现与专门为药物开发的基于规则的常用方法一样好。但它也发现了一些通常不参与药物代谢的酶,这些酶是现有方法无法发现的。
“我们的系统可以与基于规则的系统进行同样好的预测,我们没有在系统中添加任何需要人工操作和专家知识的规则,”Kavraki说。“使用基于机器学习的方法,我们正在训练一个系统来理解人类的新陈代谢,而不需要以规则的形式明确地对这些知识进行编码。这项工作在两年前是不可能的。”
Kavraki是诺亚哈丁计算机科学教授,生物工程、机械工程、电气和计算机工程教授,也是莱斯大学肯肯尼迪研究所主任。莱斯大学和德克萨斯癌症预防与研究所支持了这项研究。
有话要说...