本文介紹了基於 PAINS 和警報結構的篩選方法,並簡要比較了兩者的異同。
PAINS被稱為 "泛檢測幹擾化合物",是藥物篩選中假陽性的主要來源,其實質包括膠體聚集化合物、自發熒光化合物、熒光素酶抑制劑、反應性化合物和多態性化合物。本質上,它們包括膠體聚集化合物、自發熒光化合物、熒光素酶抑制劑、反應性化合物和多靶點化合物。
結構警報更廣泛地定義為有害的化學結構,例如可能有毒的基團,或不穩定、容易在生物體和特定化學反應中降解的基團。這些結構需要在藥物發現過程中盡早識別和篩選出來,以避免不必要的實驗成本浪費。
PAINS 的過濾功能已集成到 RDkit 工具集中,可直接調用。
值得註意的是,PAINS 篩選的有效性在業界多次受到質疑,因為存在太多的假陽性,因此 PAINS 篩選的結果僅供參考,藥物化學家需要在有能力的情況下審查化合物的篩選結構。
與幹擾活性和親和力測試的 PAINS 結構不同,結構預警是壹個更廣泛的概念。例如,以人工智能藥物發現技術著稱的 Insilico Medicine 公司僅用 46 天就設計並篩選出了壹種 DDR1 受體抑制劑,相關成果於 2019 年 9 月發表在《自然-生物技術》上[1]。
文章中提到,Insilico Medicine 使用 150 個內部 STRUCTURE ALERT 來篩選出有毒結構、反應基團或其他不利基團,包括
針對此類警報結構的項目,我們可以通過定義 SMARTS 語法來篩選出不良化合物。
在定義了警報結構後,我們可以通過使用 rdkit 中的子結構匹配功能將其過濾掉
對於我們的待過濾化合物庫(以 SMILES 格式作為數據幀存儲),我們可以應用上述函數對其進行過濾。
與 PAINS 類似,警報結構並非絕對指標,使用前應由藥物化學家進行審查。
此外,葛蘭素史克公司(GSK)根據多年積累的高通量篩選結果,以及其內部化合物庫中 200 萬個化合物在數百次試驗中的實驗結果,統計總結出了自己的壹套警戒結構庫,可作為擴展閱讀參考[2]。
文章中收錄了葛蘭素史克的警示結構,並將其存儲為 SMARTS 結構,為不熟悉 SMARTS 的讀者省去了自行轉換的麻煩。