众所周知,蛋白质担负着生命体的各种生理功能,是生物性状的直接表达者。蛋白质与小分子化合物的相互作用是进行药物设计的基础。在分子水平上深入研究蛋白质与药物分子的结合机理有助于为筛选及研发药效高、应用广及毒副作用小的新药提供丰富的计算依据,大大缩短现有的实验发现流程并降低临床失败风险。
利用人工智能构建蛋白质和小分子的亲和力预测模型,用于筛选有效的药物候选分子,将大大加快药物研发流程,让患者得到最及时的治疗。
致病蛋白质有很多,它们的结构序列都藏在df_protein.csv
数据集中(Sequence特征)。能与这些致病蛋白相结合的小分子(df_molecule.csv中的Fingerprint特征表示了其结构)也被发现,并附上了它们的理化属性。此外,在df_affinity.csv数据集中,包含了蛋白质和小分子之间的亲和力数值(Ki特征)。
时间紧迫!作为算法科学家的你,能够仅仅在六周时间里,从测试集中预测出致病蛋白和小分子的亲和力值,从而找出最有效的药物分子吗?
参赛时间:2018年4月9日--2018年5月21日