當前位置:偏方大全网 - 中藥材 - 中藥指紋圖譜的數據挖掘

中藥指紋圖譜的數據挖掘

指紋特征信息的分析和提取也稱為數據挖掘。中藥指紋圖譜形象地反映了藥用植物物種的次生代謝具有遺傳特性,由於受地域、生長環境、收獲等諸多不確定因素的影響,在統計學上具有多元隨機分布的模糊性。數據挖掘技術是利用模糊數學、統計學和計算機技術,建立壹種同時反映這兩種特征的方法的過程,即從中藥指紋圖譜數據庫中提取隱藏的、潛在適用的模式。它是發現和分析中藥指紋圖譜潛在信息的有力工具,旨在評價和控制中藥質量,研究中藥的定量成分-活性關系(QCAR)。它包括三個過程;

中藥指紋圖譜需要研究如何利用這些信息實現指紋圖譜的知識化。指紋圖譜的知識包括信息解讀、比較判斷、化學信息與藥效信息的相關性研究、信息利用,即從大量的指紋圖譜數據中獲取相關的規律和知識。采用的方法包括聚類分析、模式識別、相關分析、人工神經網絡等。

(1)聚類分析

聚類分析是將研究對象按照壹定的規律和要求進行分類。基本思想是用“相似度”來衡量樣本之間的接近程度,實現分類。壹般相似度大的樣本歸入壹類,相似度小的樣本歸入不同的類。計算機可以快速識別不同批次中藥樣品的色譜指紋圖譜,並根據批次間的相似度來判定中藥樣品的穩定性。

模糊聚類分析的基本步驟如下:

A.計算樣本之間的相似度,形成模糊相似度矩陣r,在m個量化指紋特征組成的m維空間中,樣本之間的相似度可以用多種方式定義。如:相關系數法、最大最小值法、算術平均最小值法、幾何平均最小值法、絕對指數法、廣義角度余弦法、馬氏距離法、歐氏距離法等等。

B.用上述方法建立的模糊相似關系矩陣R具有自反性和對稱性,但沒有傳遞性。需要將模糊相似關系矩陣R轉化為模糊等價關系矩陣R’,然後對其進行分類。

c .取m的某個值作為等價矩陣的截面矩陣,根據不同的值得到動態聚類譜系圖。

(2)模式歧視

模式識別的基本思想是先建立標準樣品模式的色譜指紋圖譜,然後用計算機分析未知模式(待識別樣品)的色譜指紋圖譜,根據其與標準樣品模式的“隸屬度”來判斷未知模式的真偽和優劣。

(3)相關性分析

眾所周知,衡量藥品質量的最終標準是療效。通過化學分析控制藥品質量是壹種間接的質量控制方法。壹般來說,西藥是單壹成分的化合物或化學成分明確的混合物。這些化學成分的性質和數量決定了藥物的療效。因此,對這些化學成分進行定性和定量控制,可以全面控制藥品的內在質量。但是,中醫不同於西醫。中藥就相當於壹個大復方,成分眾多且復雜。中藥的化學成分大多不完全清楚,壹些已知的成分也不代表中藥的全部療效。因此,傳統的質量控制模式,即單壹成分的定性定量分析,難以控制藥品的質量。就中藥指紋圖譜而言,也存在指紋圖譜與藥效脫節的問題。所謂關聯度,是指兩個系統或兩個因素之間相關性的度量。關聯度描述了系統發展過程中各因素的相對變化。如果兩者在發展過程中的相對變化基本相同,則認為兩者高度相關;相反,它們之間的相關性很小。

(4)人工神經網絡

隨著模式識別理論的發展,人工神經網絡的實踐得到了迅速的提高,並在許多領域得到了廣泛的應用。自1990以來,人工神經網絡逐漸應用於中醫藥研究領域。與經典模式識別相比,神經網絡方法更接近人腦的思維過程,具有自組織和容錯的優點。神經網絡結構和學習算法有很多種,其中BP(反向誤差傳播)、ART、MBL和FANN主要用於中藥指紋圖譜。

(5)其他

實現指紋知識的方法有峰重疊法、夾角法、決策樹、遺傳算法和最近鄰法。最近出現了幾種相似度計算方法。將從藥材、中間體到最終產品的大量指紋圖譜收集到數據庫中,利用數學方法確定峰間的相關性,實現生產全過程的“全過程質量管理”,而對於基礎研究和新藥開發,則可以實現全過程化學成分的表征。再加上多維信息的指紋圖譜(HPLC/PDAD/MS/MS),整個研究需要處理的信息非常多,建立壹個智能的指紋數據庫可以較好的解決這類問題。

  • 上一篇:玉屏風散的功效與作用,玉屏風散有什麽功效與作用?
  • 下一篇:鐵皮石斛成分檢測
  • copyright 2024偏方大全网