2019年5月15日,清華大學(xué)藥學(xué)院2014級(jí)本科生唐子琦在優(yōu)秀本科生國(guó)際交流項(xiàng)目中赴UCSF交流學(xué)習(xí)期間以第一作者身份在《自然·通訊》在線發(fā)表了題為《Interpretable classification of Alzheimer’s disease pathologies with a convolutional neural network pipeline》的研究論文,首次報(bào)道了利用深度學(xué)習(xí)算法自動(dòng)且有效地對(duì)阿爾茲海默癥患者大腦中的β-淀粉樣蛋白斑塊(Amyloid-β plaque)和血管異常進(jìn)行病理學(xué)分析。該研究提出了一種深度學(xué)習(xí)的訓(xùn)練方法,使得計(jì)算機(jī)能夠精確的檢測(cè)人腦組織中β-淀粉樣蛋白斑塊,此方法揭示了自動(dòng)化阿爾茲海默癥研究關(guān)鍵部分的可能。
阿爾茲海默癥是癡呆癥中最常見(jiàn)的一種,但對(duì)該疾病成因和治療方面的研究進(jìn)展十分緩慢。β-淀粉樣蛋白斑塊作為阿爾茲海默癥的病理學(xué)標(biāo)志之一,是神經(jīng)病理學(xué)中的重要研究對(duì)象,但識(shí)別和分析大量人腦組織樣本中不同形態(tài)的β-淀粉樣蛋白斑塊沉淀十分困難且耗時(shí)。
為了增強(qiáng)對(duì)阿爾茲海默癥病理學(xué)的分析能力,研究人員設(shè)計(jì)了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型。CNN是一種深度學(xué)習(xí)算法,能夠從大量數(shù)據(jù)中提取潛在的規(guī)律和模式,并據(jù)此對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè)。為了獲得足夠的數(shù)據(jù)來(lái)訓(xùn)練CNN進(jìn)行人腦組織病理學(xué)分析,研究人員開(kāi)發(fā)了一個(gè)網(wǎng)絡(luò)平臺(tái)“Blob or Not”,使得病理學(xué)家能夠高效的標(biāo)注數(shù)以萬(wàn)計(jì)的潛在斑塊區(qū)域圖片。研究小組利用由7萬(wàn)張已標(biāo)注的病理學(xué)圖片組成的數(shù)據(jù)集來(lái)訓(xùn)練CNN模型,以識(shí)別阿爾茲海默癥中不同類型的大腦變化,包括區(qū)分Cored plaque和Diffuse plaque,以及識(shí)別腦血管中的異常病變。研究結(jié)果表明,此算法能夠以98.7%的準(zhǔn)確率處理整個(gè)大腦切片,處理速度只受限于所使用的計(jì)算機(jī)處理器數(shù)量。同時(shí),研究小組對(duì)此算法的可靠性和可解釋性進(jìn)行了嚴(yán)格測(cè)試,以確保其在生物學(xué)分析上是有效的。在未來(lái),研究人員希望這些算法將成為神經(jīng)病理學(xué)研究的標(biāo)準(zhǔn)部分,幫助病理學(xué)家分析大量實(shí)驗(yàn)和臨床數(shù)據(jù),打開(kāi)精確治療癡呆癥的大門。

圖:CNN模型在不同尺度上對(duì)人腦切片中病理學(xué)特征的預(yù)測(cè)
該工作由UCSF的Michael Keiser課題組和UC Davis的Brittany Dugger課題組合作完成,Michael Keiser教授和Brittany Dugger教授為共同通訊作者。該課題受到National Institutes of Health (P30 AG010129)和a Paul G. Allen Family Foundation Distinguished Investigator Award的資助。唐子琦同學(xué)在UCSF兩年的交流學(xué)習(xí)受到中國(guó)留學(xué)基金委的資助。
原文鏈接:
https://doi.org/10.1038/s41467-019-10212-1