藥物研發側重於什麽數據結構？

結構生物學與醫學和藥物研發密切相關，可以說促進了醫學的發展。

結果如下:

1，測序和序列比對測序是生物信息學的基礎和主要數據來源，可以是人類數據，也可以是其他數據。序列比對的基本問題是比較兩個或多個符號序列的相似性或不相似性。從生物學的本意來說，這個問題包含以下含義:從重疊的序列片段中重建DNA的完整序列；從各種實驗條件下的探針數據確定物理和遺傳圖譜存儲，遍歷和比較數據庫中的DNA序列，比較兩個或兩個以上序列的相似性，在數據庫中搜索相關序列和子序列，找出核苷酸的連續生成模式，找出蛋白質和DNA序列中的信息成分，比較DNA序列的生物學特征，如局部插入、缺失(前兩者簡稱為indel)和置換。序列的目標函數獲得序列間變異集的最小距離加權和或最大相似和。對齊的方法包括全局對齊、局部對齊、代溝懲罰等。動態規劃算法常用於比較兩個序列，適用於序列長度較小的情況，但不適用於海量基因序列(如人類DNA序列高達109bp)，甚至算法復雜度是線性的。因此，啟發式方法很難奏效。

2、蛋白質結構比較和預測。

基本問題是比較兩個或兩個以上蛋白質分子空間結構的相似性或相異性。蛋白質的結構和功能密切相關。壹般認為，功能相似的蛋白質，結構壹般是相似的。蛋白質是由氨基酸組成的長鏈，長度從50到1000~3000AA(氨基酸)不等。蛋白質有很多功能，如酶、物質的儲存和運輸、信號傳遞等。抗體等。氨基酸的序列內在地決定了蛋白質的三維結構。壹般認為蛋白質有四種不同的結構。研究蛋白質的結構和預測的原因是:在醫學上了解生物體的功能，尋找對接藥物的目標，在農業上獲得更好的農作物基因工程。酶促合成用於工業。直接比較蛋白質結構的原因是蛋白質的三維結構在進化中比壹級結構更穩定，也比AA序列包含更多的信息。蛋白質三維結構研究的前提是內部氨基酸序列與三維結構壹壹對應(不壹定成立)。物理學可以用最小能量來解釋。通過觀察和總結已知結構的蛋白質結構規律來預測未知蛋白質的結構。同源建模和線程方法屬於這壹類。同源性建模用於尋找相似度高的蛋白質結構(30%以上氨基酸相同)，後者用於比較進化家族中不同的蛋白質結構。然而，蛋白質結構預測的研究現狀遠不能滿足實際需要。3.基因鑒定。

基因識別的基本問題是正確識別基因在給定基因組序列中的範圍和確切位置。非編碼區由內含子組成，通常在蛋白質形成後被丟棄，但從實驗來看，如果去掉非編碼區，基因復制就無法完成。顯然，DNA序列作為壹種遺傳語言，不僅包含在編碼區，它還隱含在非編碼序列中。目前沒有分析非編碼區DNA序列的通用指導方法。在人類基因組中，並不是所有的序列都被編碼，也就是某種蛋白質模板，編碼的部分只占人類基因總序列的3-5%。顯然，人工搜索這麽大的基因序列是不可想象的。檢測密碼區的方法包括測量密碼區中密碼子的頻率。壹階和二階馬爾可夫鏈，ORF(開放閱讀框)，啟動子識別，HMM(隱馬爾可夫模型)和GENSCAN，剪接比對等等。

4.分子進化和比較基因組學

分子進化是利用不同物種中相同基因序列的異同來研究生物的進化，構建進化樹。既可以利用DNA序列，也可以利用其編碼的氨基酸序列，甚至可以通過相關蛋白質的結構比較，在相似人種遺傳相似的前提下完成。通過對比，可以發現不同種族中哪些是相同的。有什麽區別？早期的研究方法通常使用外部因素，如大小、膚色和四肢數量，作為進化的基礎。近年來，隨著許多模式生物基因組測序任務的完成，人們可以從全基因組的角度研究分子進化。在匹配不同種族的基因時，壹般要處理三種情況:直向同源:功能相同的不同種族的基因；旁系同源:功能不同的同種族基因；異種基因:通過其他方式在生物之間傳播的基因，如病毒註射的基因。該領域常用的方法是構建系統發育樹，通過基於特征(即氨基酸堿基在DNA序列或蛋白質中的具體位置)和距離(比對得分)的方法以及壹些傳統的聚類方法(如UPGMA)來實現。5.組裝重疊群根據目前的測序技術，在每個反應中只能檢測500個或更多的堿基對序列。比如短槍法用於測量人類基因，需要大量的短序列全部形成重疊群。將它們逐漸拼接在壹起以形成更長的序列重疊群直到獲得完整序列的過程被稱為重疊群組裝。從算法層面來看，序列的重疊群是壹個NP完全問題。遺傳密碼的起源通常認為密碼子和氨基酸的關系是由生物進化史上的壹個偶然事件引起的，壹直固定在現代生物的同壹個祖先身上，直到現在。與這種“冷凍”理論不同的是，有人提出了三種解釋遺傳密碼的理論，即選擇優化、化學和歷史。隨著各種生物基因組測序任務的完成，為研究遺傳密碼的起源和檢驗上述理論的真實性提供了基礎。

上一篇:司法鑒定的主要內容和種類有哪些？

下一篇:癌癥患者如何申請使用麻醉藥品?

十分實際早安語錄好像便是送給我的！(精選59句)