當前位置:偏方大全网 - 藥品查詢 - 中藥指紋圖譜的數據挖掘

中藥指紋圖譜的數據挖掘

指紋圖譜的特征信息的分析與提取又稱作數據挖掘。中藥指紋圖譜形象地反映了藥用植物物種具有遺傳特性的次生代謝“***有特征”,又由於次生代謝中地域、生長環境、采收等多種不定因素影響,具有統計學中多元隨機分布的“模糊性”。數據挖掘技術就是利用模糊數學、統計學、計算機技術等建立壹種同時反映這兩種特征的方法,即從中藥指紋圖譜數據信息庫中提取隱含的及有潛在應用價值、最終可理解的模式的過程。它是發現和解析中藥指紋圖譜潛在信息的有力工具,目的是評價和控制中藥質量及研究中藥定量組效關系(quantitative composition-activity relationship,QCAR);包含三個過程;

中藥指紋圖譜 獲得信息化後的指紋圖譜,需要研究如何來利用這些信息,即實現指紋圖譜知識化。指紋圖譜知識化包括信息解讀、比較和判斷,化學信息和藥效信息相關性研究和信息的利用,即從大量指紋圖譜數據中得到有關規律和知識。采用的方法有聚類分析、模式判別、關聯度分析、人工神經網絡等。

(1)聚類分析

聚類分析就是根據壹定的規律和要求,對研究的對象進行分類。其基本思路是用“相似度”來衡量樣品之間的親疏程度,並以此來實現分類。通常將相似度大的樣本歸為壹類,相似度小的樣本歸為不同類。對於不同批次的中藥樣品其色譜指紋圖經計算機快速辨識處理可依據樣品批與批之間的相似度,確定中藥樣品批間的穩定性。

模糊聚類分析的基本步驟如下:

A. 計算樣品之間的相似度,並將其構成模糊相似關系矩陣R。在由m個己量化的指紋特征組成的m維空間中,可用多種方法定義樣品之間的相似度。如:相關系數法、最大最小法、算術平均最小法、幾何平均最小法、絕對指數法、廣義夾角余弦法、馬氏距離法、歐氏距離法等。

B. 用上述方法建立起來的模糊相似關系矩陣R,只有自反性和對稱性,而沒有傳遞性,需要將模糊相似關系矩陣R改造為模糊等價關系矩陣R`,再進行分類。

C. 取壹定M值,作等價矩陣的截矩陣,依據取值的不同得到動態聚類譜系圖。

(2)模式判別

模式判別的基本思路是先建立標準樣本模式的色譜指紋圖譜,然後對未知模式(待鑒定樣品)色譜指紋圖譜進行計算機解析,依據其與標準樣本模式的“隸屬度”、判別未知模式的真偽及優劣。

(3)關聯度分析

眾所周知,衡量藥品質量的終極標準是藥效。采用化學分析方法控制藥品質量是壹種間接的質量控制手段。壹般來說,西藥是成分單壹的化合物或化學成分明確的混合物,這些化學成分的性質和數量決定了藥品的療效,因此定性和定量地控制這些化學成分就可全面地控制藥品的內在質量。但中藥與西藥不同,中藥相當於壹個大復方,其成分多而復雜,大部分中藥的化學成分不完全明確,某些已知成分並不能代表中藥的全部療效,因此傳統的質量控制模式即單壹成分的定性與定量難以控制藥品質量。就中藥指紋圖譜而言,也存在著指紋圖譜與藥效相脫節的問題。所謂關聯度,是指兩個系統或兩個因素間關聯性大小的量度。關聯度描述了系統發展過程中因素間相對變化的情況。如果兩者在發展過程中相對變化基本壹致,則認為兩者關聯度大;反之,兩者關聯度小。

(4)人工神經網絡

隨著模式識別理論的發展,人工神經網絡的實踐也得到了迅速的提高,在諸多領域都有廣泛應用。1990年以來,人工神經網絡在中藥研究領域逐漸得到了應用。與經典模式識別相比,神經網絡法更接近人腦思維過程,具有自組織性和容錯性的優點。神經網絡的結構和學習算法已有很多種,在中藥指紋圖譜中用到的主要有BP(反向誤差傳播),自適應神經網絡(ART),自適應線性機(MBL)及模糊神經網絡(FANN)。

(5)其他

實現指紋圖譜知識化的方法還包括峰重疊法、夾角法、決策樹,遺傳算法及近鄰算法等。近來又出現了幾種相似度計算的方法。 將從藥材、中間體直至最終產品的大量指紋圖譜匯集成數據庫,采用數學方法比對等,就能確定各個峰之間的相關性,從而做到對整個生產過程實現“全過程質量管理”,而對基礎研究和新藥開發,則可實現全過程化學成分群的表征。再加上多維信息(HPLC/PDAD/MS/MS)的指紋圖譜,對整個研究而言存在大量信息需要處理,建立指紋圖譜智能數據庫,就能較好的解決此類問題。

  • 上一篇:求出門在外應該知道的常識。
  • 下一篇:地震知識和防災方法
  • copyright 2024偏方大全网