通過變分推理解卷積空間轉錄組譜(DestVI)是壹種用於ST數據多分辨率分析的概率方法。DestVI通過連續的潛在變量顯式模擬細胞類型的變化,而不是將分析局限於細胞類型的離散視圖。這種連續的細胞內類型變化和相應的細胞類型特定的配置文件是通過條件深度生成模型,特別是使用解碼器神經網絡的變分推理來學習的。在這個方案中,兩個不同的潛在變量模型(LVM)分別為scRNA-seq (scLVM)和ST數據(stLVM)構建。DestVI還假設觀察到的轉錄本數量遵循負二項式分布。StLVM使用scLVM訓練的解碼器神經網絡,通過使用最大後驗概率(MAP)推斷方案獲得細胞類型的比例,其中假設每個點觀察到的轉錄本數量遵循推斷的單個細胞的加權負二項分布。
RCTD最初是為Slide-seq數據設計的,但也可用於其他ST數據。它假設觀察到的每個斑點的斑點水平基因數服從泊松分布,並通過包含基因特異性隨機效應項來解釋平臺效應。RCTD首先使用外部scRNA-seq參考數據來估計每種細胞類型的平均基因表達譜。然後,通過選擇跨細胞類型的差異表達(DE)基因進行基因篩選,並估計基因特異性平臺效應的方差。將推斷的平臺效應插入概率模型,以獲得細胞類型比率的最大似然估計(MLE)。
STdeconvolve是壹種用於ST數據的無參比和無監督細胞型去卷積方法。STdeconvolve與其他方法的主要區別在於,STdeconvolve可以在不使用外部scRNA-seq參考的情況下執行細胞類型去卷積。該方法基於潛在的狄利克雷分布(LDA)來識別每種細胞類型的估計轉錄譜及其在每個ST點中的比例,其被定義為由多項式分布建模的預定數量的細胞類型和由均勻狄利克雷分布導出的細胞類型分布的混合物。STdeconvolve假設每種細胞類型中都有高度* * *表達的基因,並選擇顯著過度分散的基因來通知潛在的細胞類型。
立體鏡實現去卷積,利用註釋的scRNA-seq參考和ST數據在空間上繪制細胞類型。立體鏡還依賴於通常使用的假設,即空間和單細胞數據的計數遵循負二項式分布。立體鏡包含壹個噪聲項,作為“虛擬”細胞類型的壹種形式來解釋不對稱數據集,其中細胞類型在空間和單細胞數據中並不完全重疊。MLE用於使用scRNA-seq參考數據估計細胞類型特異性參數,MAP用於推斷ST數據中的細胞類型混合。
SPOTlight是壹種去卷積算法,它使用非負矩陣分解(NMF)回歸算法和非負最小二乘法(NNLS)。在SPOTlight中,執行NMF以識別scRNA-seq參考中的細胞類型特異性頂譜,執行NNLS以識別斑點頂譜,這是去卷積的結果。此外,據報道,SPOTlight在不同的生物場景和不同的技術版本中,通過匹配和外部參考,表現得靈敏而準確。
DSTG是壹種基於相似度的半監督圖卷積網絡(GCN)模型,可以還原每個點的細胞類型比例。通過使用scRNA-seq數據,DstG首先通過隨機匯集從scRNA-seq數據中選擇的2至8個細胞作為ST點,構建了稱為“偽ST”的合成ST數據。然後,為了捕捉點之間的相似性並合並偽ST和真實ST數據,DSTG通過在典型相關分析(CCA)識別的* * *享受空間中尋找最近鄰居來學習鏈接圖。半監督GCN通過偽ST數據和真實ST數據以及連接圖進行訓練,可以用來預測真實ST數據中細胞類型的比例。
簡而言之,許多功能強大的ST反卷積工具已經開發出來,並專門為ST數據集定制。這些方法在模擬和真實數據集上都證明了它們的實用性。通過了解ST數據中細胞比例和空間信息的變化,用於下遊分析,可以更好地揭示潛在的生物學機制,進壹步發現利用scRNA-seq數據集無法實現的新發現。然而,沒有對這些細胞去卷積方法進行公正和全面的比較。我們將使用幾個真實的ST數據集,包括單細胞水平分辨率和帶病理學家評論的點水平分辨率ST數據,系統客觀地評估這些方法的性能。
總之,在不同的組織類型中,沒有壹種方法能永遠優於其他方法。在研究中測試的大多數概率方法,尤其是敏捷、RCTD、細胞定位和立體鏡,在整個組織中具有壹致的高性能。STdeconvolve作為唯壹的非參考方法,具有識別組織結構和細胞混合物的能力,但細胞類型作圖必須小心處理。對各種情況進行了徹底的評估,包括不同的組織,不同的技術和數據分辨率,不同的單細胞和斑點數量,以及用於分析的基因數量和類型。因此,建議研究者首先確定壹些我們評估的與自身數據最匹配的情景,並在這些情景下選擇最佳方法。
通過使用適當選擇的方法和基因組,我們希望細胞圖譜推斷準確性的提高將有助於未來的下遊分析
對噪聲和高維ST數據進行去噪和降維,可以允許更有效的信息提取。我們期望細胞型反卷積將進壹步受益於有效去噪和降低ST數據維數的發展和進步。
生活很好,有妳更好。