图1. DNA复制中的解旋酶(左图,Armin Mortazavi绘制)及解旋酶超家族。
为构建这个以解旋酶为核心的筛选集,我们首先整合了来自ChEMBL、PubChem、DrugBank及科学文献的数据,汇集了已知具有解旋酶相关活性的分子参考集。通过提取专利和文献出版物中的可用数据,我们最终建立了包含2,745个生物活性化合物的参考数据库,这些化合物来自九种不同的解旋酶检测实验,涵盖以下解旋酶靶点:
- Probable global transcription activator SNF2L2 (helicase activity)
- Bloom syndrome protein (ATP-dependent DNA helicase)
- Replication protein E1 (ATP-dependent DNA helicase)
- Transcription activator BRG1 (helicase activity)
- Eukaryotic initiation factor 4A-III (ATP-dependent RNA helicase)
- Hepatitis C virus NS3 protease/helicase
- ATP-dependent RNA helicase DDX3X
- Replicative DNA helicase
- Chromo domain-containing protein 1 (helicase activity)
- ATP-dependent DNA helicase Q1
- DnaC helicase
- Werner syndrome ATP-dependent helicase
- Replicase polyprotein 1ab
- Bloom syndrome protein (ATP-dependent DNA helicase)
随后,对内部数据库进行了分子描述符分析,采用84%的Tanimoto相似度阈值筛选参考集中的小分子类似物,最终鉴定出3800余种具有解旋酶抑制潜力的筛选化合物。
图 2. 解旋酶靶向库中的靶点分布
*ChEMBL 数据库中的文献编号:CHEMBL3822370、CHEMBL4014334、CHEMBL1134109、CHEMBL1201862、CHEMBL1145280、CHEMBL1148307、CHEMBL1139458、CHEMBL4049423、CHEMBL1138995