英矽智能(Insilico Medicine)的研究團(tuán)隊(duì)在生物信息學(xué)和AI制藥領(lǐng)域再次取得突破性進(jìn)展,其最新研究成果“Precious2GPT: the combination of multiomics pretrained transformer and condIT(http://www.weberwork.com/sell/l_25/)ional diffusion for artificial multi-omics multi-species multi-tissue sample generation”在Nature旗下的npj Aging期刊上發(fā)表。該研究通過整合先進(jìn)的擴(kuò)散模型和Transformer架構(gòu),成功開發(fā)了Precious2GPT,這一創(chuàng)新模型為模擬真實(shí)世界條件、輔助生物機(jī)制和衰老過程研究提供了強(qiáng)有力的工具(http://www.weberwork.com/sell/l_5/)。
Precious2GPT:多模態(tài)、跨物種、跨組織的數(shù)據(jù)生成利器
Precious2GPT的構(gòu)建采用了混合方法,其核心在于CDiffusion模型和MoPT模型的結(jié)合。CDiffusion模型根據(jù)基因表達(dá)網(wǎng)絡(luò)模擬基因表達(dá)水平,通過納入基因間的復(fù)雜依賴關(guān)系,確保了生成數(shù)據(jù)的生物學(xué)可行性。而MoPT模型則負(fù)責(zé)評估單個(gè)基因的數(shù)據(jù)生成質(zhì)量,通過與真實(shí)世界特征的對比,給出精準(zhǔn)的質(zhì)量評分。兩者通過特征加權(quán)線性堆積(FWLS)方法高效融合,實(shí)現(xiàn)了均衡、高質(zhì)量的數(shù)據(jù)生成。
驗(yàn)證與實(shí)際應(yīng)用:從年齡預(yù)測到結(jié)直腸癌研究
在驗(yàn)證研究中,Precious2GPT展現(xiàn)了令人矚目的潛力。利用生成的數(shù)據(jù),研究團(tuán)隊(duì)不僅實(shí)現(xiàn)了更準(zhǔn)確的年齡預(yù)測,還成功生成了年齡超過120歲的人類生物學(xué)數(shù)據(jù),這在以往是極具挑戰(zhàn)性的任務(wù)。此外,通過UMAP維度降低技術(shù),研究團(tuán)隊(duì)評估了Precious2GPT在特定組織生成數(shù)據(jù)方面的能力,結(jié)果顯示生成數(shù)據(jù)與真實(shí)標(biāo)簽高度一致,驗(yàn)證了其準(zhǔn)確性和可靠性。
在結(jié)直腸癌的案例研究中,Precious2GPT進(jìn)一步展示了其實(shí)際應(yīng)用價(jià)值。通過生成結(jié)直腸癌細(xì)胞系的對照樣本,該模型通過薈萃分析提名了一系列關(guān)鍵基因表達(dá)特征,這些特征與已知的結(jié)直腸癌病理學(xué)研究結(jié)果高度匹配。這一發(fā)現(xiàn)不僅驗(yàn)證了Precious2GPT在生物信息分析中的準(zhǔn)確性,也為其在靶點(diǎn)發(fā)現(xiàn)和治療方案優(yōu)化中的應(yīng)用提供了有力支持。
未來展望:拓展應(yīng)用領(lǐng)域,深化生物信息學(xué)研究
英矽智能的科學(xué)家表示,Precious2GPT的潛力遠(yuǎn)不止于此。他們計(jì)劃將該模型的應(yīng)用進(jìn)一步擴(kuò)展到其他生物信息學(xué)任務(wù)中,包括生命周期分析、跨模態(tài)預(yù)測以及特定疾病組學(xué)數(shù)據(jù)的生成等。通過不斷優(yōu)化和完善,Precious2GPT有望成為生物信息學(xué)和AI制藥領(lǐng)域的重要工具,為揭示生物機(jī)制、加速藥物研發(fā)提供強(qiáng)有力的支持。
總之,Precious2GPT的發(fā)布標(biāo)志著英矽智能在AI制藥和多組學(xué)數(shù)據(jù)分析領(lǐng)域的又一重要里程碑。隨著該模型的廣泛應(yīng)用和深入研究,我們有望看到更多關(guān)于生物機(jī)制和疾病治療的突破性發(fā)現(xiàn)。