在上一篇理茶德給大伙帶來的非腫瘤生信分析開車指導 (非腫瘤生信分析:來不及解釋了快上車!) 后,這次由蝦餃皇來給大家帶來一篇非腫瘤生信數據挖掘文章分析啦!此外,我們近期會推出20期左右的非腫瘤生信數據分析給大家作為參考。
今天給大家帶來的是2020年3月發表在J. Cell. Mol. Med.(4.658)雜志上的文章“STAT1 and its related molecules as potential biomarkers in Mycobacterium tuberculosis infection ”。這篇文章中作者通過分析肺結核隊列GSE83456的表達數據,篩選出192個表達差異基因,進而通過進行富集分析表明這些干擾素信號傳導途徑,并且與防御反應有關。隨后,作者進行miRNA預測,繪制miRNA網絡,并使用qRT-PCR驗證了兩個靶基因為STAT1的miRNA,最后作者預測了這兩個miRNA的circRNA。
結核病(TB)是一種慢性傳染病,其臨床表現為長期低燒,咳痰和咯血,其致病菌為結核分枝桿菌(MTB),其中最常見的感染類型為肺結核(PTB),同時MTB還可以感染腸管、淋巴腺、關節、脊柱、泌尿生殖系統和其他器官或組織,導致人替功能障礙和器官組織損傷。結核病的發生、發展和結局不僅與細菌的毒性和數量,還與人體的免疫功能密切相關。人體抗結核免疫主要是細胞免疫,其中細胞因子與各類免疫細胞亞型在免疫防御起關鍵作用。此外,MTB可以阻礙氧化應激,細胞凋亡和自噬,并抑制組織相容性復合物分子的合成,從而影響抗原呈遞。
圖1:對GSE83456數據庫(排除免疫抑制性疾病的45例PTB樣品和61例健康樣品)的表達數據進行分析,篩選出192個表達差異基因,其中156個上調基因和36個下調基因。
圖2:GSEA分析顯示PTB樣本在干擾素-α/γ反應和免疫相關的功能中顯著富集。
圖3A:對192個表達差異基因進行GO富集分析,表明PTB樣品中表達差異基因主要與干擾素信號通路和免疫應答有關,其中顯著富集是I型干擾素信號通路
圖3B:ClueGO分析生物過程的相互作用網絡,并使用Cytoscape ClueGo插件可視化。
圖4:使用Funrich軟件進行富集分析,其中有163個基因用于進一步分析,表達差異基因主要富集于干擾素信號傳導通路和免疫相關通路。
圖5:使用IPA對192個表達差異基因進行核心分析,有干擾素信號通路、模式識別受體在細菌和病毒識別中作用、被胞質模式識別受體激活的IRF、抑瘤素M信號、TREM1信號、死亡受體信號、神經炎癥信號通路和和T細胞衰竭信號通路被激活。其中干擾素通路激活分數最高,其中STAT1、MX1、OAS1、SOCS1、STAT2、TAP1、IFI6、 IFI35、IFIT1、IFIT3、IFITM1、IFITM3、ISG15和JAK2與該通路相關。
圖6:IPA的生物學功能分析展示了差異基因與炎癥、抗病毒應答、免疫應答、活化、抗微生物應答、吞噬作用、趨化性、細胞運動、先天免疫應答和應答功能模塊有關。其中具體的模塊為細胞吞噬作用的免疫應答、巨噬細胞的免疫應答、抗病毒應答和先天免疫應答,被抑制的模塊為大腦的免疫反應和腦炎。同時,進行上游分析,其中排名前五的調節物為轉錄調節因子:STAT1、IRF7和細胞因子:IFNL1、IFNG、IFNA2
小結:作者使用GSEA分析、GO富集分析、Funrich富集分析、IPA核心分析與生物學功能分析證明了PTB樣品中的表達差異基因主要富集于干擾素(INF)信號通路和免疫應答。
圖7:構建192個表達差異基因的PPI網絡,有170個基因和1121種相互作用關系,不同顏色代表使用被MCODE識別的不同基因簇,黃色得分最高。
表3:對得分最高的基因簇(圖7黃色)進行BP富集分析,發現該基因簇主要為防御反應和免疫系統相關功能的基因。
圖8A:使用STRING對得分最高的基因簇進行分析,所有基因主要與對病毒的防御反應、干擾素信號傳導、干擾素α/β信號、細胞因子信號以及免疫系統相關通路有關。其中紅色表示與干擾素信號相關;藍色表示與干擾素α/β信號相關;綠色表示與免疫系統中細胞因子信號相關;黃色表示與干擾素-γ信號轉導相關。
圖8B:使用Network Analyst驗證,并且得到的基因于STRING上的基因取交集得到23個基因用于進一步分析。
圖9:作者篩選出28個與細胞因子信號相關基因進行了gene-miRNA分析,作者使用了TargetScan、miRanda、miRDB、miRWalk和RNA22數據庫預測miRNA,并且得到的結果取交集作為預測結果,并且使用Cytoscape繪制miRNA的基因的相互作用網絡,并且篩選出有兩個靶基因的9個miRNA進行進一步驗證。
圖10:qRT-PCR驗證,展示了兩個靶基因為STAT1為的miRNA(miR-223-3p和miR-448)在結核病患者血漿中明顯低于健康人的血漿。
使用StarBase預測hsa-miR-223-3p和hsa-miR-448的相應circRNA,得到兩個circRNA:SAMD8_ hsa_circRNA994和TWF1_hsa-circRNA9897。
最后小結一下,作者對肺結核隊列的表達數據進行分析,并篩選出總共192個表達差異基因使用GO分析、GSEA分析、Funrich富集分析、IPA核心分析與生物學功能分析等方法確定這些基因大多數都富集于干擾素信號傳導途徑,并且與防御反應有關。隨后,作者使用TargetScan、miRanda、miRDB、miRWalk和RNA22數據庫預測miRNA,進而進行qRT-PCR驗證,篩選出靶基因為STAT1的miRNA(hsa-miR-448和hsa-miR-223-3p)它們在肺結核患者血漿中下調,最后作者使用StarBase預測了相應circRNA。