AI 制药,让“大海捞针”变成“按图索骥”,研发时间一度从 10 年缩短到 18 个月!
而一个好的开源平台也是未来 AI 医药研发发展的关键之一。
现在,来自加拿大蒙特利尔学习算法研究所(Mila)的唐建团队,就推出了一个专门用于 AI 药物研发的开源机器学习平台 ——TorchDrug。
研究人员可以在该平台上免费使用或贡献 AI 药研相关的算法、库、软件等工具。
唐建表示:
希望这个平台能够将机器学习和生物医学界的研究人员聚集在一起,加速新药发现的过程,并在未来成为该领域一个领先的开源平台。
基于 PyTorch 的药物研发原型设计平台
TorchDrug 涵盖了从图机器学习 (图神经网络、几何深度学习和知识图谱)、深度生成模型到强化学习的技术,基于 PyTorch 平台。
该平台提供了一个全面而灵活的接口来支持药物发现模型的快速原型设计,可以用来进行成药属性预测、预训练分子表征、分子生成、逆合成以及知识图谱推理,官方也提供了详细的教程。
该平台主要有四个特点:
-
最小化的领域知识
由于平台主要面向对于医药知识了解不全面的机器学习者,所以抽象了大量专业知识,提供了一个基于张量的接口。从而允许使用者用张量代数和机器学习方法来进行医药开发。
-
大量数据集和构造块(Building Blocks)
这样无需编写样板代码就能很容易地实现标准模型。此外,构建块也具有高可扩展性方便使用者自由探索模型设计。
-
全面的基准测试
为了提供对流行的深度学习框架系统的比较,平台已对现有的一些项目进行了全面的基准测试。测试结果也有望跟踪新模型的进展,激发新的研究方向(可在官网查看)。
-
可扩展训练和推理
可扩展的设计可加速在多个 CPU 或 GPU 之间的训练和推理。只需修改一行代码,就能实现在 CPU、GPU 甚至分布式配置之间无缝切换。
后续团队将通过几何深度学习为该平台增加 3D 建模功能。
安装接口需 Python 版本 >= 3.5,PyTorch>= 1.4.0,方法有两种:
-
从 conda
-
从 GitHub 源
先通过 conda 获得 TorchDrug 依赖的化学信息学开源工具包 rdkit:
研发团队
研发团队所在的实验室 Mila,是图灵奖得主、加拿大蒙特利尔大学教授 Yoshua Bengio 于 1993 年创立的 AI 研究机构。
有 500 多名专门从事机器学习的研究人员,主要贡献集中在语言模型、机器翻译、对象识别和生成模型。
TorchDrug 平台的开发由 Mila 实验室的助理教授、加拿大蒙特利尔大学商学院博士生导师唐建领导。
唐教授 2014 年博士毕业于北京大学信息科学技术学院,2014-2016 年任职微软亚洲研究院副研究员,2016-2017 年成为密歇根大学和卡内基梅隆大学联合培养博士后。
唐教授的主要研究方向为:图表示学习、图研究网络、知识图谱、药物发现。
他曾获得机器学习顶级会议 ICML2014 的最佳论文,发表的一系列在图表示学习领域的经典论文包括 LINE、LargeVis、RotatE 以及 Graph Markov Neural Networks (GMNN)。
团队成员还包括多位该实验室的华人博士学生以及来自清华北大上交大的交换生。
他们还得到了 Bengio 等十余位 AI、生物学领域学者的指导:
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/153922.html