中大新聞網(wǎng)訊(通訊員張玉琦)非靶向代謝組學(xué)通過全面揭示生物系統(tǒng)內(nèi)小分子濃度的變化,為疾病生物標(biāo)志物的發(fā)現(xiàn)和診斷提供了重要的技術(shù)手段。代謝組學(xué)研究中的液相色譜-質(zhì)譜聯(lián)用技術(shù)(LC-MS)具有高靈敏度、高穩(wěn)定性、高檢測通量等優(yōu)勢。然而,當(dāng)前針對LC-MS代謝組學(xué)數(shù)據(jù)的分析方法面臨著復(fù)雜的挑戰(zhàn),包括數(shù)據(jù)處理的復(fù)雜性和批次效應(yīng),以及大量未知代謝物的存在等。解決這些問題對于通過代謝組學(xué)手段發(fā)現(xiàn)疾病相關(guān)新的生物標(biāo)志物和早期預(yù)測預(yù)警重大疾病的發(fā)生至關(guān)重要。
2024年8月20日,中山大學(xué)中山醫(yī)學(xué)院李偉忠團隊與中山大學(xué)腫瘤防治中心黃蓬、胡寓旻團隊合作,在Nature Communications發(fā)表了題為An end-to-end deep learning method for mass spectrometry data analysis to reveal disease-specific metabolic profiles 的研究成果。該研究開創(chuàng)性地提出可解釋性集成深度學(xué)習(xí)方法DeepMSProfiler,可端對端地進行非靶向代謝組學(xué)數(shù)據(jù)分析。DeepMSProfiler方法能夠直接將原始的LC-MS下機數(shù)據(jù)轉(zhuǎn)換為樣本所屬疾病類別、疾病相關(guān)的關(guān)鍵代謝物和疾病相關(guān)的代謝物-蛋白質(zhì)網(wǎng)絡(luò)等結(jié)果,提供了全面的疾病相關(guān)代謝組圖景。DeepMSProfiler無需使用傳統(tǒng)的代謝組學(xué)分析過程中的峰提取和識別步驟,從而避免了復(fù)雜分析過程中的誤差累積,更充分地利用了根據(jù)現(xiàn)有數(shù)據(jù)庫無法鑒定出來的未知代謝信號。重要的是,DeepMSProfiler有效地克服了來自不同醫(yī)院之間的批次效應(yīng)問題。
DeepMSProfiler利用來自多家醫(yī)院的859份肺腺癌患者、良性肺結(jié)節(jié)患者和健康人群的人血清樣本進行訓(xùn)練和測試,在獨立測試集中成功甄別了不同組別的代謝組學(xué)特征,AUC值達0.99,并在早期肺腺癌診斷中實現(xiàn)了高達96.1% 的準(zhǔn)確率。此外,該方法在來自928種細胞系的泛癌脂質(zhì)代謝組學(xué)數(shù)據(jù)上進行了擴展分析,揭示了23種癌癥類型共同相關(guān)的代謝物和蛋白質(zhì),展現(xiàn)了出色的泛化能力以及在多種疾病診斷中的應(yīng)用潛力。
簡而言之,該研究為代謝組學(xué)領(lǐng)域首個端對端分析方法,性能指標(biāo)顯著性超越傳統(tǒng)方法,為基于代謝組學(xué)的疾病診斷和生物機制發(fā)現(xiàn)提供了一個直接且可靠的方法。
該研究得到了國家重點研發(fā)計劃、廣東省基礎(chǔ)與應(yīng)用基礎(chǔ)研究基金、廣州國家實驗室重大項目等項目資助。中山醫(yī)學(xué)院博士研究生鄧永潔為該論文第一作者,中山醫(yī)學(xué)院李偉忠教授與中山大學(xué)腫瘤防治中心黃蓬教授及胡寓旻研究員為該論文共同通訊作者。