代謝組學3。數據分析

1.代謝物提取壹般需要每組至少10個樣本；

2.從所有提取的樣品中取等量的混合物作為QC；

3.QC樣本和實驗樣本穿插在計算機上，從十個QC開始，到三個QC結束，每十個樣本中穿插壹個QC樣本。

。

得到質譜數據通過軟件處理得到峰表。

峰表格式壹般為:每行壹個m/z，每列壹個樣品。

數值代表樣品中m/z的信號響應。

第壹列是保留時間_質荷比來表示離子，比如0.10 _ 96.9574 m/z。

壹般有以下幾點:

1.數據預處理。如缺失值過濾和填充、數據規範化等。

2.數據質量控制。包括CV分配，QC等。

3.統計分析。包括單變量、多變量等。

4.功能分析。包括通路、網絡分析、生物標誌物篩選等。

缺失值處理

1)缺失原因

A.信號太弱，檢測不到；

B.檢測誤差，如離子抑制或儀器性能不穩定；

C.峰值提升的算法受限，無法從背景中提取低信號；

D.在解卷積過程中，並非所有重疊峰都能被分離。

2)缺失值過濾

例如:

去除QC樣品中超過50%的缺失；

去除樣本中超過80%的缺失值。

3)缺少值填充

-最小填充量

-平均/中值填充

- KNN( k近鄰)填充

- BPCA(貝葉斯主成分分析)填充

- PPCA(概率PCA)填充

-奇異值分解

壹般推薦KNN。

噪聲信號去除

壹般是低質量離子。

1)低質量離子的測定；

計算QC樣品中離子的RSD(標準偏差/平均值);數值越小，偏差越小；

2)判斷標準:

-對於單個離子峰，RSD

-對於總體數據，RSD 60%，總體數據合格；

樣本標準化

目的是提高樣本之間的可比性。

樣本之間是有差異的，比如不同人的尿液濃度不同，不能直接比較。

可在采集前進行歸壹化，如肌酐歸壹化；也可以采集後歸壹化，如sum、pqn、分位數等。對於數據分析，通常是後者，比如求和歸壹化。

數據變換

下遊分析壹般要求數據為正態分布或高斯分布；

因此，通常需要對數據進行對數或冪變換，兩者都可以消除最大值的抑制作用，調整數據的分布，如下圖所示；

對數變換對零值很敏感，必須先去掉零值。

數據轉換-縮放

目的是消除最大效應。

如果不同樣本中相同m/z的強度差異過大而無法調整，最大值的存在往往會掩蓋較低值的變化特征。

所有樣本中某個m/z的強度值可以除以壹個因子(SD值)；

自動(uv)、pareto(推薦)、vast、range等方法。

相當於上述用於樣品可比性的樣品標準化和用於離子可比性的縮放。

QC樣本的TIC重疊

人們普遍認為:

所有QC樣品峰重疊良好；

峰值強度波動差別不大；

履歷

主成分分析中質量控制樣本的聚集度

QC樣本的相關性

單變量分析

壹次只分析壹個變量，也就是壹個m/z，看這個m/z在不同組、不同樣本中的表達有沒有差異？

常見的方法有多重分析、t檢驗、秩和檢驗、方差分析等。

聚類分析

核心思想是根據具體指標(變量)對研究樣本進行分類；

聚類分析需要設定壹種方法來度量樣本之間的相似性或相異性(常用的有歐氏距離、相關系數等。);

常見的聚類方法:系統聚類(層次聚類)、K- means聚類等。

K- means首先要估計會劃分出多少個類，然後根據相似度的遠近將所有基因歸入這些類。

K- means比層次聚類具有更少的計算量和更高的效率。

不管是哪種分類方法，最終應該分成多少個類別，並不完全由方法本身決定，而應該由研究者結合具體問題來決定。

聚類分析是壹種探索性的數據分析方法。對同壹數據使用不同的分類方法，會得到不同的分類結果。分類結果沒有對錯，只是分類標準不同。

使用聚類方法時，首先要明確分類的目的，然後考慮選擇哪些變量(或數據)參與分類，最後再考慮方法的選擇。

多變量分析

1)主成分分析

以下是分數(樣本在新坐標系中的位置)

)和載荷圖(載荷圖，原始變量和主分量之間的角度)

PCA怎麽看？

2)偏最小二乘法

PLSDA的圖類似於PCA。只是監督學習的壹種方法，預先對樣本進行分類，最後看是否能把不同的群體分開。

R2和Q2被用來評估模型。

R2是相關系數，表示這個模型的擬合效果，是壹個定量的度量(範圍0-1)，表示建立的模型能在多大程度上代表真實數據；

壹般R2在0.7-0.8時，說明模型的解釋力好，差模型的R2往往在0.2-0.3。

Q2代表PLS-DA模型的預測能力；

壹般Q2大於0.5，說明預測能力好，R2和Q2的數值應該比較接近。

排列檢驗模型用於擬合檢驗。

可變重要性投影

每個m/z都有壹個VIP值，表示這個m/z在壹個主分量上的投影，即重要程度；

壹般我們用第壹和第二主成分的VIP來表示這個m/z對模型分類的貢獻，VIP >；=1被認為是重大貢獻。

代謝組學數據分析的最後兩個部分-功能分析和生物標誌物篩選將在下壹節中顯示。

上一篇:中藥可以加糖減肥嗎？

下一篇:藿香正氣散的功效與作用，藿香正氣中藥的功效與作用

產後出血的常見原因有哪些，產後多久可以吃通草？

甜根根的甘草加工-兩草五節

東阿阿膠有保質期嗎？