當前位置:偏方大全网 - 中藥材 - 代謝組學3。數據分析

代謝組學3。數據分析

1.代謝物提取壹般需要每組至少10個樣本;

2.從所有提取的樣品中取等量的混合物作為QC;

3.QC樣本和實驗樣本穿插在計算機上,從十個QC開始,到三個QC結束,每十個樣本中穿插壹個QC樣本。

得到質譜數據通過軟件處理得到峰表。

峰表格式壹般為:每行壹個m/z,每列壹個樣品。

數值代表樣品中m/z的信號響應。

第壹列是保留時間_質荷比來表示離子,比如0.10 _ 96.9574 m/z。

壹般有以下幾點:

1.數據預處理。如缺失值過濾和填充、數據規範化等。

2.數據質量控制。包括CV分配,QC等。

3.統計分析。包括單變量、多變量等。

4.功能分析。包括通路、網絡分析、生物標誌物篩選等。

缺失值處理

1)缺失原因

A.信號太弱,檢測不到;

B.檢測誤差,如離子抑制或儀器性能不穩定;

C.峰值提升的算法受限,無法從背景中提取低信號;

D.在解卷積過程中,並非所有重疊峰都能被分離。

2)缺失值過濾

例如:

去除QC樣品中超過50%的缺失;

去除樣本中超過80%的缺失值。

3)缺少值填充

-最小填充量

-平均/中值填充

- KNN( k近鄰)填充

- BPCA(貝葉斯主成分分析)填充

- PPCA(概率PCA)填充

-奇異值分解

壹般推薦KNN。

噪聲信號去除

壹般是低質量離子。

1)低質量離子的測定;

計算QC樣品中離子的RSD(標準偏差/平均值);數值越小,偏差越小;

2)判斷標準:

-對於單個離子峰,RSD

-對於總體數據,RSD 60%,總體數據合格;

樣本標準化

目的是提高樣本之間的可比性。

樣本之間是有差異的,比如不同人的尿液濃度不同,不能直接比較。

可在采集前進行歸壹化,如肌酐歸壹化;也可以采集後歸壹化,如sum、pqn、分位數等。對於數據分析,通常是後者,比如求和歸壹化。

數據變換

下遊分析壹般要求數據為正態分布或高斯分布;

因此,通常需要對數據進行對數或冪變換,兩者都可以消除最大值的抑制作用,調整數據的分布,如下圖所示;

對數變換對零值很敏感,必須先去掉零值。

數據轉換-縮放

目的是消除最大效應。

如果不同樣本中相同m/z的強度差異過大而無法調整,最大值的存在往往會掩蓋較低值的變化特征。

所有樣本中某個m/z的強度值可以除以壹個因子(SD值);

自動(uv)、pareto(推薦)、vast、range等方法。

相當於上述用於樣品可比性的樣品標準化和用於離子可比性的縮放。

QC樣本的TIC重疊

人們普遍認為:

所有QC樣品峰重疊良好;

峰值強度波動差別不大;

履歷

主成分分析中質量控制樣本的聚集度

QC樣本的相關性

單變量分析

壹次只分析壹個變量,也就是壹個m/z,看這個m/z在不同組、不同樣本中的表達有沒有差異?

常見的方法有多重分析、t檢驗、秩和檢驗、方差分析等。

聚類分析

核心思想是根據具體指標(變量)對研究樣本進行分類;

聚類分析需要設定壹種方法來度量樣本之間的相似性或相異性(常用的有歐氏距離、相關系數等。);

常見的聚類方法:系統聚類(層次聚類)、K- means聚類等。

K- means首先要估計會劃分出多少個類,然後根據相似度的遠近將所有基因歸入這些類。

K- means比層次聚類具有更少的計算量和更高的效率。

不管是哪種分類方法,最終應該分成多少個類別,並不完全由方法本身決定,而應該由研究者結合具體問題來決定。

聚類分析是壹種探索性的數據分析方法。對同壹數據使用不同的分類方法,會得到不同的分類結果。分類結果沒有對錯,只是分類標準不同。

使用聚類方法時,首先要明確分類的目的,然後考慮選擇哪些變量(或數據)參與分類,最後再考慮方法的選擇。

多變量分析

1)主成分分析

以下是分數(樣本在新坐標系中的位置)

)和載荷圖(載荷圖,原始變量和主分量之間的角度)

PCA怎麽看?

2)偏最小二乘法

PLSDA的圖類似於PCA。只是監督學習的壹種方法,預先對樣本進行分類,最後看是否能把不同的群體分開。

R2和Q2被用來評估模型。

R2是相關系數,表示這個模型的擬合效果,是壹個定量的度量(範圍0-1),表示建立的模型能在多大程度上代表真實數據;

壹般R2在0.7-0.8時,說明模型的解釋力好,差模型的R2往往在0.2-0.3。

Q2代表PLS-DA模型的預測能力;

壹般Q2大於0.5,說明預測能力好,R2和Q2的數值應該比較接近。

排列檢驗模型用於擬合檢驗。

可變重要性投影

每個m/z都有壹個VIP值,表示這個m/z在壹個主分量上的投影,即重要程度;

壹般我們用第壹和第二主成分的VIP來表示這個m/z對模型分類的貢獻,VIP >;=1被認為是重大貢獻。

代謝組學數據分析的最後兩個部分-功能分析和生物標誌物篩選將在下壹節中顯示。

  • 上一篇:中藥可以加糖減肥嗎?
  • 下一篇:藿香正氣散的功效與作用,藿香正氣中藥的功效與作用
  • copyright 2024偏方大全网