(請先閱讀 “對論文格式的統壹要求”)
B題: 艾滋病療法的評價及療效的預測
艾滋病是當前人類社會最嚴重的瘟疫之壹,從1981年發現以來的20多年間,它已經吞噬了近3000萬人的生命。
艾滋病的醫學全名為“獲得性免疫缺損綜合癥”,英文簡稱AIDS,它是由艾滋病毒(醫學全名為“人體免疫缺損病毒”, 英文簡稱HIV)引起的。這種病毒破壞人的免疫系統,使人體喪失抵抗各種疾病的能力,從而嚴重危害人的生命。人類免疫系統的CD4細胞在抵禦HIV的入侵中起著重要作用,當CD4被HIV感染而裂解時,其數量會急劇減少,HIV將迅速增加,導致AIDS發作。
艾滋病治療的目的,是盡量減少人體內HIV的數量,同時產生更多的CD4,至少要有效地降低CD4減少的速度,以提高人體免疫能力。
迄今為止人類還沒有找到能根治AIDS的療法,目前的壹些AIDS療法不僅對人體有副作用,而且成本也很高。許多國家和醫療組織都在積極試驗、尋找更好的AIDS療法。
現在得到了美國艾滋病醫療試驗機構ACTG公布的兩組數據。 ACTG320(見附件1)是同時服用zidovudine(齊多夫定),lamivudine(拉美夫定)和indinavir(茚地那韋)3種藥物的300多名病人每隔幾周測試的CD4和HIV的濃度(每毫升血液裏的數量)。193A(見附件2)是將1300多名病人隨機地分為4組,每組按下述4種療法中的壹種服藥,大約每隔8周測試的CD4濃度(這組數據缺HIV濃度,它的測試成本很高)。4種療法的日用藥分別為:600mg zidovudine或400mg didanosine(去羥基苷),這兩種藥按月輪換使用;600 mg zidovudine加2.25 mg zalcitabine(紮西他濱);600 mg zidovudine加400 mg didanosine;600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韋拉平)。
請妳完成以下問題:
(1)利用附件1的數據,預測繼續治療的效果,或者確定最佳治療終止時間(繼續治療指在測試終止後繼續服藥,如果認為繼續服藥效果不好,則可選擇提前終止治療)。
(2)利用附件2的數據,評價4種療法的優劣(僅以CD4為標準),並對較優的療法預測繼續治療的效果,或者確定最佳治療終止時間。
(3) 艾滋病藥品的主要供給商對不發達國家提供的藥品價格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考慮4種療法的費用,對(2)中的評價和預測(或者提前終止)有什麽改變。
統計回歸模型
摘要:
當人們對研究對象的內在特征和各因素間的關系有比較充分的認識時,壹般用機理分析方法建立數學模型,如果由於客觀事物內部規律的復雜性及人們認識程度的限制,無法分析對象內在的因素關系,建立合乎機理規律的數學模型,那麽通常的辦法是搜集大量的數據,基於對數據的統計分析去建立模型,建立統計回歸模型。醫藥上的藥物療效也是通過大量的實驗得出的數據來分析藥物的作用的,下面我們就此建立統計回歸數學模型來進行合理的分析。
關鍵詞:
疼痛減輕時間,用藥劑量,性別,血壓組別
壹 問題的提出:
壹個醫藥公司的新藥研究部門為了掌握壹種新止痛劑的療效,設計了壹個藥物試驗,給患有同種疾病的病人使用這種新止痛劑的以下4個劑量中的某壹個:2g,5g,和 10g ,並記錄每個病人病痛明顯減輕的時間。為了了解新藥的療效與病人性別和血壓有什麽關系,試驗過程中研究人員把病人按性別及血壓得低,中,高三檔平均分配來進行測試,通過比較每個人病人的血壓歷史數據,從高到低分稱三組,分別計作0.25,0.50,0.75。實驗結束後,公司的記錄結果見下表(性別以0表示女,1表示男)
請根據這些數據為公司建立模型,根據病人的用藥劑量,性別和血壓組別,預測出服藥後病痛明顯減輕的時間
病人序號 疼痛減輕時間 用藥劑量 性別 血壓組別
1 35 2 0 0.25
2 43 2 0 0.5
3 55 2 0 0.75
4 47 2 1 0.25
5 43 2 1 0.5
6 57 2 1 0.75
7 26 5 0 0.25
8 27 5 0 0.5
9 28 5 0 0.75
10 29 5 1 0.25
11 22 5 1 0.5
12 29 5 1 0.75
13 19 7 0 0.25
14 11 7 0 0.5
15 14 7 0 0.75
16 23 7 1 0.25
17 20 7 1 0.5
18 22 7 1 0.75
19 13 10 0 0.25
20 8 10 0 0.5
21 3 10 0 0.75
22 27 10 1 0.25
23 26 10 1 0.5
24 5 10 1 0.75
二 模型分析與假設:
從我們所得到的數據可以分析出疼痛減輕時間與血壓,用藥量,性別有關系。
設疼痛時間為Y,用藥量為x1,血壓為x2,性別為x3。數據中同列相同值但是疼痛時間不同,這說明疼痛時間的確是與我們索要找的三個因變量有關的。
下面,我們利用matlab工具來分析壹下Y與 三個變量的關系
其中紅色代表x2與Y之間的關系,綠色代表x1與Y之間的關系,藍色代表x3與Y之間的關系。
從上面的圖,我們估計Y與x1,x2,x3之間是壹個非常復雜的關系,這是壹個多元的關系,這樣我們假設壹個數學模型:
Y=b0+ b1*x1^(-1) +b2*x2+b3*x3 +b4*x2.^2+b5*x1.^2+b6*x1*x2+b7*x3*x2+b8*x1*x3+ε
模型就這樣假設了。
三 模型的建立與求解
Y=b0+b1*x1^(-1) +b2*x2+ b3*x3 +b4*x2.^2+b5*x1.^2+b6*x1*x2+b7*x3*x2+b8*x1*x3+ε這樣壹個模型是否合理,需要我們求證。用matlab下的regress命令求結果
初次求出來的結果為
B = [b bint] =
13.662 -5.6564 32.98
42.81 17.188 68.432
23.428 -52.668 99.524
3.439 -10.701 17.579
0.011172 -0.13567 0.15801
12 -59.606 83.606
-5.3213 -8.8549 -1.7877
-20 -40.671 0.67096
1.7602 0.31369 3.2067
R=[r rint]=
-4.0578 -10.85 2.7348
-1.5042 -9.9542 6.9459
3.5495 -3.3525 10.452
5.9829 -0.33157 12.297
1.5365 -6.9187 9.9917
-6.4098 -12.625 -0.19447
3.5415 -5.1727 12.256
3.0861 -6.107 12.279
1.1308 -7.7466 10.008
-0.69838 -9.6193 8.2225
-4.1537 -13.195 4.8877
4.891 -3.5476 13.33
1.3802 -7.7566 10.517
-5.4144 -14.475 3.6458
-2.7091 -11.695 6.2764
-5.3799 -14.004 3.2443
-2.1746 -11.648 7.2986
4.5307 -4.1953 13.257
0.63615 -6.5528 7.8251
0.83246 -7.6901 9.355
-0.47123 -7.7354 6.793
-1.4045 -8.5766 5.7675
7.7918 0.47479 15.109
-4.5119 -11.348 2.3241
Stats =[ 0.91844 21.113 7.7489e-007]
從中我們可以看出,R.^2值為91.844%,F值為21.113。R^2的值還不夠合符要求,而F卻很小,這樣我們建立的模型不太符合要求。我們可以用殘差分析,來建立相對較好的模型。於是,我們考慮是否其中有的項不需要呢,或者還需要添壹些項呢。然後我們用stepwise的命令來進行分析:
當我們建立Y= b0*x0+ b1*x1.^(-1) +b2*x2 +b3*x3 +b4*x2.^(-1) +b5*x1.*x2 +b6*x1.*x3 b7*x2.*x3統計模型時,進行殘差分析
所得的最好的殘差的效果圖為
這時,R.^2=91.0316% F = 36.5407,這樣F的值大壹點了,殘差分析說明b0,b3,b4的值為0,他們的對應項對目標函數的影響很少,可以忽略不計。
但是我們是否能找到更好的模型來取代當前所求得的這個模型呢,因為F的紙還不是很合理。
我們繼續分析題中要求。題中用藥量根據常識應該是跟疼痛時間成反比,因為用藥量越少,疼痛時間越大。還有,血壓大的話,疼痛時間應該越大。另外血壓應該是與性別有聯系的,
當我們建立Y= b0*x0+ b1*x1+b2*x2 +b3*x3+ b4*x2.^2 +b5*x1.*x2 +b6*x1.*x3 b7*x2.*x3+b8*x.^2 統計模型時,進行殘差分析,所得的結果如圖所示
明顯比剛才的數據要好很多了,我們繼續對此模型進行調整,或許能夠找到壹組比如上圖形更好的數據。
繼續查找後,所得又壹結果如圖
從上圖我們可以看出,R^2 = 94.0512% , F = 56.9166,這又是壹個好的數據結果,
依此圖建立的數學模型為
Y= b0*x0+ b1*x1+b2*x.1^2+ b3*x2.^2 +b4*x1.*x2 +b5*x1.*x3 + b6*x2.*x3
這說明,疼痛的時間與用藥量成二次項關系,與血壓成二次項關系,模型中含有所有變量的交叉項。
而對其他模型
如Y= b0*x0+ b1*x1.^(-1)+b2*x2 +b3*x3+ b4*x2.^2 +b5*x1.*x2 +b6*x1.*x3 b7*x2.*x3+b8*x.^2
所得的結果如下圖
這樣的結果明顯較上面結果不好。
R.^2 很小。
所以我們確定了模型
Y= b0*x0+ b1*x1+b2*x.1^2+ b3*x2.^2 +b4*x1.*x2 +b5*x1.*x3 + b6*x2.*x3
再來看看它的置信區間
bint=
43.642 61.974
-10.213 -3.9083
0.28145 0.74077
24.195 60.862
-10.151 -4.5978
0.43864 1.4715
所有的系數的置信區間不通過原點,且數據比較合理,
再看殘差
r =
-4.7019
-0.98862
1.4086
5.388
-2.8987
1.4985
2.2782
4.5224
1.4506
0.50291
-5.2529
-2.3247
0.82047
-2.248
0.36743
-1.8649
0.066566
1.682
-4.5328
0.92964
1.0761
-0.083352
9.3791
-6.4745
每個數據的大小不是很大,這樣那麽我們將所有變量的實際值拿出來建立實際模型
Y= 52.808-7.0608*x1+0.51111*x.1^2+ 42.528*x2.^2 -7.3746*x1.*x2 +0.95506*x1.*x3
這個模型基本上是滿足要求的。
所以我就確定了該模型。
四 模型結果
Y= 52.808-7.0608*x1+0.51111*x.1^2+ 42.528*x2.^2 -7.3746*x1.*x2 +0.95506*x1.*x3
五 模型應用
當利用此模型來求疼痛時間時,只要給了我們三個變量基本的數據,我們可以很好的求出結果來。
比如 x1 = 2 x2 = 0.5 ,x3 = 0
則 Y = 40.7308 與所給數據 43 相差不大,模型得到很好的應用。
《數學建模》
出版社:高等教育出版社 作者:姜啟源 謝金星 葉 俊
駱吉洲老師的課件 MATLAB軟件簡介 數學建模課件
妳可以先熟悉了解壹下本地導航,它可以根據妳的實際情況進行導航。