色欲天天天综合网,亚洲男人成人性天堂网站,国产成人午夜福利在线观看视频

技術(shù)文章您的位置：網(wǎng)站首頁 >技術(shù)文章 >WGCNA分析流程及內(nèi)容解讀: WGCNA分析流程及內(nèi)容解讀

更新時(shí)間：2024-12-06 點(diǎn)擊次數(shù)：110次

文章標(biāo)題：通過 WGCNA 和機(jī)器學(xué)習(xí)識(shí)別和驗(yàn)證與免疫和氧化應(yīng)激相關(guān)的糖尿病腎病診斷標(biāo)記物
發(fā)表年限：2023年
期刊：Frontiers in Immunology
影響因子：5.7
研究背景：
糖尿病腎病（DN）以蛋白尿、高血壓和腎功能進(jìn)行性減退為特征，是發(fā)達(dá)國家終末期腎病最常見的病因，造成了嚴(yán)重的社會(huì)和經(jīng)濟(jì)負(fù)擔(dān)。研究表明，隨著全球糖尿病發(fā)病率的上升，DN患者的人數(shù)也在不斷增加，預(yù)計(jì)在未來20年左右的時(shí)間里，全球糖尿病發(fā)病率將從5.37億人上升到7.83億人。與此相反，目前的治療方案強(qiáng)調(diào)腎素-血管緊張素系統(tǒng)阻斷、血壓管理和血糖控制。因此，DN診斷和治療迫切需要新的靶點(diǎn)。近年來，隨著生物信息學(xué)的發(fā)展，其研究技術(shù)已被積極用于探索包括DN在內(nèi)的多種疾病的靶點(diǎn)。
研究結(jié)果：
本文中，作者使用R軟件包"WGCNA"構(gòu)建了WGCNA，以識(shí)別與糖尿病腎病患者免疫細(xì)胞相關(guān)性最高的模塊。具體來說，首先對(duì)樣本數(shù)據(jù)進(jìn)行了預(yù)處理，并剔除了異常值。隨后，"WGCNA"軟件包構(gòu)建了相關(guān)矩陣。選擇最佳軟閾值將相關(guān)矩陣轉(zhuǎn)換為鄰接矩陣，并根據(jù)鄰接矩陣創(chuàng)建拓?fù)渲丿B矩陣（TOM）。利用基于TOM的相異性度量，采用平均關(guān)聯(lián)分層聚類將具有相似表達(dá)模式的基因歸類為基因模塊。與免疫細(xì)胞相關(guān)性較強(qiáng)的兩個(gè)模塊被選為關(guān)鍵模塊，用于后續(xù)分析。

該研究中軟閾值功率校準(zhǔn)為0.85（圖B）。最后，WGCNA分析顯示了11個(gè)模塊的總和（圖C）。其中，綠色模塊和品紅色模塊分別與T細(xì)胞CD4幼稚亞群和γ δ 亞群有很強(qiáng)的正相關(guān)性。由于綠色模塊和品紅色模塊與免疫浸潤細(xì)胞有重要關(guān)聯(lián)，因此考慮對(duì)這兩個(gè)模塊進(jìn)行進(jìn)一步研究。
從上述文章中可以看出，WGCNA分析可用于識(shí)別高度相關(guān)的基因模塊，總結(jié)模塊之間的相互聯(lián)系以及與外部樣本性狀的關(guān)聯(lián)，并識(shí)別候選生物標(biāo)記物或治療靶點(diǎn)。
WGCNA，全稱為weighted gene co-expression network analysis，即加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析。它是一種分析多個(gè)樣本基因表達(dá)模式的分析方法，可將表達(dá)模式相似的基因進(jìn)行聚類，并分析模塊與特定性狀或表型之間的關(guān)聯(lián)關(guān)系，在研究表型性狀與基因關(guān)聯(lián)分析等方面的研究中被廣泛應(yīng)用。
1.數(shù)據(jù)輸入、清洗和預(yù)處理
使用R包"WGCNA“進(jìn)行分析，輸入數(shù)據(jù)一般為fpkm表達(dá)量數(shù)據(jù)，推薦5組(或者15個(gè)樣品)以上的數(shù)據(jù)，數(shù)據(jù)的行為基因，列為不同樣本的基因表達(dá)量。
2.使用goodSamplesGenes檢查缺失值和識(shí)別離群值（異常值）
如果gsg$allOK的結(jié)果為TRUE，證明沒有缺失值，可以直接下一步。如果為FALSE，則需要用以下函數(shù)進(jìn)行刪除缺失值。
對(duì)所有樣本進(jìn)行聚類，觀察是否有離群值或異常值，如果有離群值則要?jiǎng)h去離群的樣本。

3. 讀入樣本信息并進(jìn)行篩選，得到表型數(shù)據(jù)與表達(dá)量數(shù)據(jù)二者共有的樣本數(shù)據(jù)，并重新構(gòu)建聚類樹。
顏色越深，代表這個(gè)表型數(shù)據(jù)與這個(gè)樣本的基因表達(dá)量關(guān)系越密切。將此步驟的數(shù)據(jù)進(jìn)行保存，命名為file1。
4.對(duì)匹配后的樣本基因表達(dá)量數(shù)據(jù)和表型數(shù)據(jù)進(jìn)行分析，選擇合適的軟閾值構(gòu)建網(wǎng)絡(luò)，并繪制層次聚類樹。

5. 選擇合適的軟閾值構(gòu)建自動(dòng)化網(wǎng)絡(luò)和檢測(cè)模塊，使用sft$powerEstimate查看推薦的軟閾值。
6.為了更清晰地反映出樣本基因的聚類關(guān)系，我們將這些基因劃分成了若干個(gè)模塊，每個(gè)模塊至少存在30個(gè)基因，每一個(gè)顏色代表一個(gè)模塊，將劃分后的模塊和樣本基因的層次聚類樹一起顯示，如下圖所示：
保存模塊信息：file2。
7.載入file1和file2，將性狀信息和模塊信息相關(guān)聯(lián)，并繪制模塊與性狀之間的相關(guān)性熱圖。
圖中紅色為正相關(guān)，藍(lán)色為負(fù)相關(guān)，顏色越深則相關(guān)性越強(qiáng)。
8.加權(quán)網(wǎng)絡(luò)可視化
可視化加權(quán)網(wǎng)絡(luò)的方法之一是制作熱圖。熱圖的每行每列代表一個(gè)基因，淺色代表低鄰接；深色代表高鄰接，基因之間的鄰接程度低意味著基因之間的度量值較小，即他們之間之間的相似性較低，這可能表示它們?cè)诒磉_(dá)模式、功能或調(diào)控方面存在較大的差異。相反，鄰接程度高表示基因之間的度量值較大，即它們之間的相似性較高。這可能表示它們?cè)诒磉_(dá)模式、功能或調(diào)控方面存在相似性。由于樣本的基因數(shù)量較多，我們從中隨機(jī)選取了400個(gè)基因進(jìn)行繪圖，圖片如下所示：
9.此外，可以使用分析結(jié)果針對(duì)特定模塊繪制相關(guān)性網(wǎng)絡(luò)圖，還可以將數(shù)據(jù)導(dǎo)入到相關(guān)軟件中（如：Cytoscape）進(jìn)行相關(guān)性網(wǎng)絡(luò)的可視化。

參考文獻(xiàn)：
[1] Xu M, Zhou H, et al. Identification and validation of immune and oxidative stress-related diagnostic markers for diabetic nephropathy by WGCNA and machine learning. Front Immunol. 2023 Feb 22;14:1084531.
[2] Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008 Dec 29;9:559.

返回列表返回頂部

上一篇 : 微生物鑒定與微生物多樣性測(cè)序：開啟微觀世界的大門

下一篇 : 原核生物中的蛋白質(zhì)表達(dá)：微生物世界的分子奇跡

国产乱子经典视频在线观看_艳妇臀荡乳欲伦交换在线播放_日韩人妻无码精品系列专区_永久免费无码av在线网站_aaa少妇高潮大片免费看

WGCNA分析流程及內(nèi)容解讀