2023年5月31日,由藥學(xué)院組織的藥學(xué)前沿學(xué)術(shù)論壇在醫(yī)學(xué)科學(xué)樓B323成功舉辦。論壇邀請(qǐng)到了臨港實(shí)驗(yàn)室副主任,華東師范大學(xué)人工智能新藥創(chuàng)智中心主任,華東理工大學(xué)上海市新藥設(shè)計(jì)重點(diǎn)實(shí)驗(yàn)室主任——李洪林教授。李洪林教授在論壇中就AI助力新藥研發(fā)進(jìn)行了學(xué)術(shù)報(bào)告。本次論壇由劉剛教授主持。
論壇伊始,劉剛老師隆重介紹了李洪林教授,并對(duì)李洪林教授的到來(lái)表示熱烈歡迎。劉剛老師和肖百龍老師共同為李洪林教授贈(zèng)送論壇紀(jì)念證書。

一、 主講嘉賓介紹
李洪林,臨港實(shí)驗(yàn)室副主任,華東師范大學(xué)人工智能新藥創(chuàng)智中心主任,華東理工大學(xué)上海市新藥設(shè)計(jì)重點(diǎn)實(shí)驗(yàn)室主任,國(guó)家杰出青年,萬(wàn)人計(jì)劃科技領(lǐng)軍人才。長(zhǎng)期從事藥物靶標(biāo)識(shí)別和藥物發(fā)現(xiàn)的計(jì)算方法及其應(yīng)用的研究。已在PNAS、Adv Sci.、Nucl. Acids Res.和J. Med. Chem.等期刊上發(fā)表SCI論文200余篇,SCI論文他引4000余次,已申請(qǐng)發(fā)明專利105項(xiàng)(獲授權(quán)專利54項(xiàng)),PCT專利32項(xiàng),軟件版權(quán)15項(xiàng),轉(zhuǎn)讓臨床前藥物6個(gè)(5個(gè)一類新藥,1個(gè)二類新藥),3個(gè)進(jìn)入臨床研究。曾獲教育部自然科學(xué)一等獎(jiǎng),第十三屆中國(guó)青年科技獎(jiǎng)等。

二、嘉賓分享

1.AIDD的研究現(xiàn)
AI在游戲、生活和科研領(lǐng)域都有重要應(yīng)用,例如圍棋程序AlphaGo、運(yùn)動(dòng)模式識(shí)別、腦機(jī)接口、AlphaFold2、chatGPT等。機(jī)器人及自動(dòng)化實(shí)驗(yàn)技術(shù)的發(fā)展,如“Chemputer”等,也給未來(lái)提供了更多可能性。
新藥從發(fā)現(xiàn)到上市需要經(jīng)歷漫長(zhǎng)的過(guò)程(12-15年),且失敗率高,常被比作是“登月工程”。許多制藥公司開始布局AI輔助新藥研發(fā)(AIDD)工作,雖然使得效率有所提高,但卻并未明顯提升獲得審批的藥物數(shù)量。2020年,AIDD進(jìn)入爆發(fā)階段。據(jù)統(tǒng)計(jì), AIDD公司開發(fā)的新藥有42個(gè)處于臨床前階段,13個(gè)處于臨床一期,11個(gè)處于臨床二期,1個(gè)處于臨床三期。其中以治療腫瘤的藥物為主。40%主要是針對(duì)舊的靶標(biāo),30%主要是基于新的靶點(diǎn),剩下的則是基于表型的藥物設(shè)計(jì)(藥物設(shè)計(jì)的方法主要包括基于靶點(diǎn)和基于表型)。雖然AIDD前景廣闊,但也面臨挑戰(zhàn),如IBM的Watson宣布折戟,一些AIDD公司也正在裁員。
2.李洪林團(tuán)隊(duì)的AIDD技術(shù)開發(fā)
2.1 構(gòu)建疾病-靶標(biāo)-藥物關(guān)聯(lián)的知識(shí)圖譜
藥物靶點(diǎn)是新藥發(fā)現(xiàn)的源泉,每一個(gè)新的靶點(diǎn)的出現(xiàn)都會(huì)伴隨著多個(gè)“重磅炸彈”級(jí)別的藥物出現(xiàn),它們大部分銷售額能達(dá)到數(shù)十億甚至上百億美元,并為該疾病治療領(lǐng)域帶來(lái)井噴式的發(fā)展。靶標(biāo)枯竭已成為全世界新藥研發(fā)的難題,發(fā)展預(yù)測(cè)新藥靶標(biāo)的方法,對(duì)于新藥項(xiàng)目至關(guān)重要。為解決這一難題,李洪林團(tuán)隊(duì)花費(fèi)近4年時(shí)間,開發(fā)了e-TSN平臺(tái),構(gòu)建了大規(guī)模的包含疾病-靶點(diǎn)-藥物關(guān)系的知識(shí)圖譜。這個(gè)知識(shí)圖譜涉及了280萬(wàn)篇文獻(xiàn)、3億對(duì)疾病-靶點(diǎn)關(guān)系。對(duì)于任意疾病,用戶可以通過(guò)評(píng)估靶點(diǎn)的新穎性(通過(guò)比對(duì)相關(guān)文獻(xiàn)的數(shù)量和發(fā)布日期)和重要性(即文獻(xiàn)中對(duì)其生物學(xué)功能的評(píng)價(jià)),發(fā)掘新靶標(biāo),并進(jìn)行科學(xué)研究的立項(xiàng)。此外,還可實(shí)現(xiàn)“老藥新用”等工作。
2.2 構(gòu)建“近藥空間”
在選擇合適的靶點(diǎn)之后,如何將藥物的化學(xué)信息和靶點(diǎn)的生物信息進(jìn)行關(guān)聯(lián)仍然是藥物設(shè)計(jì)需要解決的科學(xué)問(wèn)題。目前已知化合物數(shù)量已達(dá)到106~1010,而科學(xué)家們估計(jì)的化學(xué)空間為1060,因此大部分的科研工作者認(rèn)為已有的化學(xué)空間并無(wú)法滿足現(xiàn)在的藥物研發(fā)需求。李洪林團(tuán)隊(duì)則認(rèn)為應(yīng)該在“近藥空間”探索藥物,而不是所有空間。近藥分子通常具有很高的研究和商業(yè)價(jià)值,并主要分布在大量的專利文件中。李洪林團(tuán)隊(duì)開發(fā)了CIRS(化學(xué)信息重構(gòu)系統(tǒng)),從專利中獲得近藥空間的化學(xué)信息。CIRS能夠處理專利中的圖像、文本等多模態(tài)數(shù)據(jù),重建專利數(shù)據(jù)庫(kù)中的化學(xué)信息,結(jié)構(gòu)的識(shí)別率高達(dá)97%。例如在某美國(guó)專利的11個(gè)分子式中,CIRS能夠構(gòu)建包含208萬(wàn)個(gè)分子的化學(xué)空間。這個(gè)結(jié)果表明,通過(guò)結(jié)合已有的藥物及在研藥物的專利信息,CIRS能夠得到近乎無(wú)限大的近藥空間。科研工作者能夠利用這些化學(xué)空間得到高可合成性以及高活性的近藥分子,并結(jié)合專利中的圖譜及動(dòng)物實(shí)驗(yàn)信息,對(duì)近藥分子進(jìn)行進(jìn)一步的篩選。
3.李洪林團(tuán)隊(duì)應(yīng)用AIDD技術(shù)發(fā)現(xiàn)藥物候選物
3.1 利用骨架躍遷等方法設(shè)計(jì)肺癌藥物
肺癌是目前死亡率最高的癌癥。而表皮生長(zhǎng)因子受體(EGFR)是靶向治療非小細(xì)胞肺癌的重要靶點(diǎn)。已有的第一代EGFR藥物在化學(xué)結(jié)構(gòu)上具有較大的創(chuàng)新,但60%的病人在服藥一年內(nèi)出現(xiàn)了獲得性突變問(wèn)題,導(dǎo)致病人出現(xiàn)了耐藥性。而二代藥物的由于較大的毒副作用,并沒(méi)有獲得上市的機(jī)會(huì)。三代藥物中主要是CO-1686和AZD-9291的類似物。CO-1686在體內(nèi)被代謝后會(huì)抑制胰島素合成及血糖調(diào)節(jié)相關(guān)的兩種蛋白,使患者出現(xiàn)高血糖癥等副作用,因而未能成功上市。
李洪林團(tuán)隊(duì)準(zhǔn)確預(yù)測(cè)了AZD-9291的兩個(gè)代謝位點(diǎn),通過(guò)骨架躍遷的方式重新設(shè)計(jì)了高活性(比原始的化合物活性提高了3萬(wàn)倍)的先導(dǎo)化合物并通過(guò)測(cè)定體內(nèi)代謝產(chǎn)物實(shí)驗(yàn),驗(yàn)證了服用新的化合物并不會(huì)出現(xiàn)高血糖癥等毒副作用。最后,通過(guò)PDS模型驗(yàn)證,該化合物有較好的藥效并于2021年獲得CDE的臨床許可。后期的其他研究證實(shí)了AZD-9291在體內(nèi)的兩種主要的代謝產(chǎn)物(AZD-5104 和AZD-7550)具有更高的活性,而李洪林老師基于AI預(yù)測(cè)AZD-9291的代謝位點(diǎn)的策略,準(zhǔn)確地保護(hù)了該藥物代謝為這兩種代謝產(chǎn)物的相關(guān)的基團(tuán),進(jìn)而得到了比其他AZD-9291類似藥物更好的治療效果。
3.2 潰瘍性結(jié)腸炎大環(huán)類藥物的設(shè)計(jì)
與線性的化合物分子相比,大環(huán)類藥物具有更高的結(jié)合親和力及選擇性,且能夠突破現(xiàn)有的專利限制的優(yōu)勢(shì)。李洪林團(tuán)隊(duì)通過(guò)知識(shí)圖譜發(fā)現(xiàn),潰瘍性結(jié)腸炎目前缺少較好的藥物,且相關(guān)的靶點(diǎn)JAK2的研究相對(duì)JAK1少。目前治療該疾病的上市藥物在臨床過(guò)程中存在腦炎,但其致病的機(jī)理仍不清楚。李洪林團(tuán)隊(duì)使用相似的策略針對(duì)JAK2靶點(diǎn)進(jìn)行了藥物設(shè)計(jì)。他們從已有的藥物出發(fā),使用基于生成式的Transformer模型快速生成大環(huán)化合物,并對(duì)該化合物進(jìn)行局部?jī)?yōu)化,得到新的藥物分子。由于大環(huán)化合物合成困難,李洪林團(tuán)隊(duì)僅合成了8個(gè)分子,其中部分化合物與初始藥物相比,活性并沒(méi)有降低。同時(shí),通過(guò)激酶譜分析,設(shè)計(jì)的大環(huán)化合物有更強(qiáng)的靶向性且主要靶向JAK2。隨后,通過(guò)體內(nèi)實(shí)驗(yàn)驗(yàn)證,新的藥物能夠靶向治療潰瘍性結(jié)腸炎。
這兩個(gè)案例都證明了基于知識(shí)圖譜尋找靶點(diǎn)并根據(jù)已有藥物進(jìn)行局部?jī)?yōu)化獲得新的藥物的方法的可行性。李洪林老師也通過(guò)這兩個(gè)案例,與大家分享了藥物研發(fā)過(guò)程中需要關(guān)注的問(wèn)題。比如在肺癌藥物設(shè)計(jì)過(guò)程中,藥物的ADMET性質(zhì)對(duì)于藥物設(shè)計(jì)至關(guān)重要。此外,在使用生成式的AI技術(shù)時(shí),如何化學(xué)合成這些化合物往往是一個(gè)更大的挑戰(zhàn)。
4. 李洪林老師對(duì)AIDD未來(lái)的展望
最后,李洪林教授介紹了AI未來(lái)應(yīng)用的場(chǎng)景。基于AI的藥物研發(fā)技術(shù)從分子生成開始,逐步經(jīng)歷自動(dòng)合成、自動(dòng)分析、自動(dòng)分離提純、自動(dòng)篩選等步驟,形成高度自動(dòng)化、集成化的發(fā)展趨勢(shì),為高通量篩選、體內(nèi)評(píng)價(jià)提供更好的支持。未來(lái)自動(dòng)化、集成化技術(shù)將成為藥物研發(fā)的關(guān)鍵技術(shù),有望加速藥物發(fā)現(xiàn)的過(guò)程,提高藥物研發(fā)的效率和準(zhǔn)確性。

三、交流與討論
講座結(jié)束后,藥學(xué)院的老師及同學(xué)們積極提出了許多問(wèn)題,以下是問(wèn)題精選:
Q:使用人工智能進(jìn)行靶點(diǎn)預(yù)測(cè)的準(zhǔn)確性如何,是否有進(jìn)行回顧性研究,譬如在免疫治療方法出現(xiàn)之前,AI是否能夠預(yù)測(cè)PD1是一個(gè)重要的靶點(diǎn)?
A:回顧性的研究正在進(jìn)行,例如目前有一個(gè)免疫方面的研究,能夠?qū)⑾鄳?yīng)的靶點(diǎn)預(yù)測(cè)相關(guān)的文獻(xiàn)進(jìn)行排序。
Q:環(huán)狀化合物是否使用口服給藥,是否有口服利用度等研究?
A:大部分是通過(guò)口服給藥,雖然大環(huán)類藥物的水溶性較差,但與一般藥物相比,能夠更好地透過(guò)血腦屏障,治療腫瘤的腦轉(zhuǎn)移。而口服利用度可以使用一些化學(xué)修飾或者制劑的方法進(jìn)行優(yōu)化。
Q:在構(gòu)建知識(shí)圖譜的過(guò)程中,如何避免被已有的數(shù)據(jù)網(wǎng)站使用更多的數(shù)據(jù)進(jìn)行快速跟進(jìn)?
A:數(shù)據(jù)的標(biāo)注是數(shù)據(jù)變成可用知識(shí)的必經(jīng)之路,這個(gè)過(guò)程不僅需要科學(xué)人員具有大量的專業(yè)知識(shí)儲(chǔ)備,更需要耗費(fèi)非常大的人力資源及時(shí)間成本,因此是構(gòu)建知識(shí)圖譜的核心競(jìng)爭(zhēng)力。
Q:骨架躍遷成功率比較高的原因是什么?
A:團(tuán)隊(duì)在2012年開發(fā)了eSHAFTS,是國(guó)內(nèi)首個(gè)基于分子三維相似性的藥物設(shè)計(jì)軟件,主要是考慮到了分子的形狀和藥效特征,目前可在團(tuán)隊(duì)網(wǎng)站上進(jìn)行下載和使用。
Q:目前是否有相關(guān)工作取代人來(lái)選擇靶點(diǎn)?
A:Insilico Medicine基于組學(xué)數(shù)據(jù)預(yù)測(cè)靶點(diǎn),但是選擇靶點(diǎn)還應(yīng)考慮到臨床和市場(chǎng)的需求。


