mRNA藥物在疫苗、癌癥免疫療法等領域具有重要的研究價值,mRNA-LNPs的篩選是一項非常有挑戰的任務。人工智能賦能科學研究(AI for Science)技術的興起給mRNA-LNPs快速篩選帶來新手段,利用人工智能模型構建分子三維微觀結構與生化性質間的映射關系,實現生化性質的精準預測,是未來快速設計自主高轉染效率的mRNA-LNPs的重要途徑。
針對上述問題,中國科學院上海高等研究院(以下簡稱“上海高研院”)工業人工智能劉立莊研究團隊在mRNA藥物遞送系統脂質納米顆粒人工智能可解釋性預測模型方面取得重要進展,提出了一種基于Transformer和Mamba的多模態可解釋的性質預測模型(TransMA),結果是當前最優,相關研究成果以“TransMA: an explainable multi-modal deep learning model for predicting properties of ionizable lipid nanoparticles in mRNA delivery”為題發表在生物信息期刊Briefings In Bioinformatics上。
本研究設計基于Transformer和Mamba的多模態可解釋的性質預測模型,稱為TransMA(圖1)。TransMA針對分子三維和一維信息多模態特征提取和交互,設計Transformer和狀態空間Mamba融合架構;結合均方誤差(MSE)損失函數和三元組損失函數,提出一種自適應混合損失函數,對于多模態特征融合提升預測精度具有重要價值;在特征對齊和融合方面,提出一種分子通道注意力機制,建模出分子特征通道之間的相互依賴性,評估原子級注意力分數,識別關鍵分子結構。TransMA識別出的高注意力分數的原子與實際影響性質的關鍵原子是一致的(圖2),實現模型可解釋性,同時,TransMA實現預測均方誤差MSE為3.64,決定系數(??2)0.49,對比多種基于圖卷積神經網絡和Transformer架構,結果顯示(圖3),在均方誤差、決定系數R2和皮爾遜相關系數評價指標中性能最優,指標再次達到該領域最優水平。
圖1 TransMA架構圖
圖2 TransMA識別出的高注意力分數的原子與實際影響性質的關鍵原子對應圖
圖3 TransMA與多種基于圖卷積神經網絡和Transformer架構結果對比圖
該工作實現快速精準預測mRNA-LNPs的轉染效率,能夠快速篩選出穩定有效的LNPs,提高mRNA藥物遞送效率,為多種疾病的個性化治療提供可靠研究方法和工具,新方法將推動mRNA藥物在基因治療、疫苗開發和藥物遞送等領域的應用發展。論文的第一作者是上海高研院碩士研究生武坤、通訊作者劉立莊正高級工程師,聯合了日本筑波大學王梓旭博士、華中師范大學楊秀隆博士和意大利熱那亞大學Fulvio Mastrogiovanni教授共同完成。
文章鏈接:https://doi.org/10.1093/bib/bbaf307