漫话开发者 - UWL.ME Mobile

Biohub近日向全球研究人员开放了其蛋白质结构预测、设计与生物发现的开源引擎,标志着蛋白质生物学领域迈入AI驱动的新阶段。该发布包含三个核心模型:ESMC,一种最先进的语言模型,内化了支配蛋白质生物学的基本属性,能够理解蛋白质序列与功能的关系;ESMFold2,一个设计引擎,可将ESMC的序列表征转化为原子分辨率的生物分子复合物三维结构;以及ESM Atlas,一个可导航图谱,覆盖68亿蛋白质序列和11亿预测结构,使研究人员能够在大规模数据中快速探索蛋白质空间。所有模型均免费提供,旨在加速治疗分子设计、酶工程和基础生物学研究。此举将AI模型从实验室工具升级为全球性开放科学平台,有望显著降低药物研发成本,并推动个性化医疗的发展。Biohub强调,这些模型基于公开数据集训练,并已通过多个外部验证案例证明其预测准确性,为科学界提供了强有力的计算工具。

核心要点

  • Biohub发布开源蛋白质生物学引擎,包含ESMC语言模型、ESMFold2设计引擎和ESM Atlas图谱,覆盖68亿序列和11亿结构。
  • ESMC内化了蛋白质生物学的核心属性,ESMFold2可将序列转化为原子分辨率的3D结构,加速治疗分子设计。
  • 所有模型免费开放给全球科学界,有助于降低药物研发成本并推动个性化医疗应用。

Read more >