2007-2008學年第壹學期
課程所在學校:經濟管理學院
壹、選擇題(此大題為* * 15小題,每個小題為1分,* * 15分)
每個問題所列的四個選項中,只有壹個符合題目要求。請在題目後的括號內填寫其代碼。錯選、多選或不選都不計分。
1.下列哪壹項不屬於壹元回歸中的基本假設(D)?
A.對於所有x,誤差項的方差是相同的。
B.誤差項服從正態分布。
C.誤差項是相互獨立的
D.
2.當壹組數據分布的偏度系數為負時,數據的眾數、中位數、均值之間的關系為(A)。
A.多數>;中位數>平均值/均值
B.平均值>;中位數>模式
C.中位數>;多數>;平均值/均值
D.中位數>;平均值>模式
3.壹元回歸方程為y = 11.64-0.25x,則下列說法正確的是(c)。
A.自變量平均增加1個單位,因變量平均減少0.25個單位。
B.自變量和因變量之間存在正相關關系。
C.
D.
4.如果有兩組數列A和B,那麽(A)數列的平均數具有很強的代表性。
A.1 < 2 1 > 2,數列B的平均值的代表性高。
B.1 < 2 1 > 2,B系列平均值的代表性較低。
C.1 = 2 1 > 2,則數列A的平均值的表示高。
D.1 = 2 1 < 2,A系列平均值的代表性較低。
5.如果連續變量序列的最後壹組是開組,下限為500,相鄰組的組中值為480,那麽最後壹組的組中值為(a)。
520 B.510 C.500 D.540
6.不受極端變量值影響的平均值是(d)。
A.算術平均值b .調和平均值
C.幾何平均d .模式
7.有20名工人看管機器,數量如下:2,5,4,4,3,4,2,2,4,3,4,6,3,4,5,2,4。如果根據上述數據編制頻率分布序列,應采用(a)。
A.單項分組b .等距分組c .不等分組d .以上分組均可。
8.如果沒有季節變化,季節比應該是(b)。
A.0b.1 C .大於1 D .小於1
9.如果壹個定性變量有M個類別,則有必要引入(c)個虛擬變量。
上午下午+1
C.m-1 d .無法判斷。
10.第壹組工人平均工齡為5年,第二組為7年,第三組為10年。第壹組工人人數占總數的20%,第二組占60%,所以三組工人的平均工齡為(b)。
A.8年B.7.2年C.5年D.7.8年
11.某企業2007年各種產品的產量比2006年增加了8%,總生產成本增加了12%,故該廠2007年的單位成本為(D)
A.減少了0.62% B .增加了0.62%。
C.它減少了3.7%,而d .它增加了3.7%。
12.相關系數r和斜率b2 (A)的符號。
A.相同b .不同
C.無法判斷
13.據知,小姜買入的兩只股票的綜合價格指數上漲了24點。該股今日平均收盤價為14元,前天平均收盤價為(C)。
10.64
C.11.29d .無法計算。
14.如果今年的增長率與去年相比是112%,去年的增長率與前年相比是3%,那麽今年的平均增長率就是(D)。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知1%本年增加的絕對值為0.54,去年比上年增加的絕對值為5,則去年比上年的增長率為(c)。
9.3%和8.7%
C.10.2% D .無法計算。
二、選擇題(每小題2分,***16分)
每個問題都列出了幾個符合題目要求的選項。請將正確選項前的字母放在題目後的括號內。多選、少選、錯選都是沒有分數的。
1.下列變量是離散變量。
A.庫存產品數量b .流動資產對流動負債的比率
C.貨物總重量d .按個人計量的貨物數量
E.收費公路的交通量f .出席公司年會
2.指出以下數據收集屬於通過實驗收集數據的方法(A B E)
A.培訓機票代理人的新方法與傳統方法的比較
通過讓兩組可比較的孩子用兩種不同的組裝說明組裝玩具來比較兩種組裝說明。
壹份產品評估雜誌給它的訂戶郵寄了壹份問卷,要求他們對最近購買的產品進行排名。
在購物中心采訪顧客,問他們為什麽在那裏購物。
e通過在兩個可比較的地區采用不同的方法來比較兩種不同的養老金促進方法。
3.下列關於群極限的表述哪壹個是正確的(A B D)。
A.根據員工人數,相鄰組的組界限可以重疊,也可以不連續。
b員工按薪金分組,他們的組限額必須重疊。
C.學生按成績分組,分組限制必須中斷。
D.人是按照身高分組的,他們的分組界限壹定是重疊的。
4.下列屬於質量指數的有(A B D E)。
A.價格指數b .單位成本指數
C.銷售量指數d .工資水平指數
E.勞動生產率指數
5.具體來說,如果下列(A B C)發生,這意味著多重* * *線性可能存在於多重回歸模型中。
A.模型中的獨立變量對之間存在顯著的相關性。
B.線性關系顯著,但回歸系數的t檢驗不顯著。
C.回歸系數的符號與預期相反。
D.
6.算術平均數具有下列哪個性質(B C)?
A.(x-) =最小值B. (x-) = 0
C.(x-) 2 =最小D. (x-) 2 = 0
E.(X- )=1
7.在頻率分布系列中。
A.總次數是壹定的,頻率和頻率成反比。b .每組頻率之和等於100。
C.每組頻率大於0,頻率之和等於1 d,頻率越小,這組值的作用越小。
E.頻率表示每組變量值對總體的相對影響。
8.標準偏差。
A.表示總體單位標誌值的壹般水平b .反映總體單位的壹般水平
C.反映整體單位標誌值的分散程度d .反映整體分布的集中趨勢
E.反映整體分布趨勢。
三、簡答題(本大題***2題,每題5分,***10分)
1.年化增長率是多少?有什麽用?
2.數值型數據的分組方法有哪些?簡述組間距分組的步驟。
(1)可分為單變量值分組和組距分組兩種分組方式。
單變量值分組:以壹個變量值為壹組;適用於離散變量;適用於變量值很少的情況(+1)
組間距分組:以壹個變量值的區間為壹組;適用於連續變量;適用於變量值較多的情況;需要遵循“不重不漏”的原則;可以使用等長分組或不等長分組。(+1)
(2) A .確定組數:
(+1)
b確定組距:類寬是壹個組的上限和下限之差,可以根據所有數據的最大值和最小值以及劃分的組數(+1)來確定。
c .統計每組的頻率,並將其排列成頻率分布表。(+1)
四。是非題(這個大題是***5個小題,每個小題是1分,還有***5分)
1.當相關系數為+1時,兩個變量完全相關,當相關系數為-1時,兩個變量不相關。(錯誤)
2.如果各種商品價格平均上漲5%,銷量平均下降5%,銷售指數不變。(錯誤)
3.連續變量和離散變量按組間距分組時,可通過相鄰組的組間距重疊來確定組限。(右)
4.根據建立的線性回歸方程,我們無法判斷兩個變量之間的相關程度的緊密程度。(右)
5.設p代表單位成本,q代表產量,那麽∑p1q1—∑p0q1代表產品單位成本的變化對總產出的影響。(錯誤)
四、計算分析題(***54分)
1.將郵局中出境包裹樣品的重量近似為盎司:21,18,30,12,14,17,28,10,16。計算這組數據的均值、中位數、眾數、極差和四分位區間,從偏度的角度描述數據的分布形態(10分)。
2.表1列出了學生在為期三周的商業統計課程中的課外學習時間以及課程結束時他們的考試成績的樣本數據如下:
表1學生課外學習時間及考試成績統計表
學生樣本1 2 3 4 5 6 7 8
學習時間,X 20 16 34 23 27 32 18 22
測試分數,Y 64 61 84 70 88 92 72 77
用EXCEL回歸,結果如下:(***15分)
匯總輸出
回歸統計
倍數R 0.862109
r平方0.743232
調整後的R平方0.700437
標準誤差6.157605
觀察值8
方差分析
顯著性F
回歸分析+0 658 . 586868868686
剩余6 227.4966 37.438+01
共計7 886人
系數標準誤差t統計P值
截距40.08163265 8.889551 4.50884785 0.0065471
x變量1 1.496598639 0.359119 4.16741915 0.005895457
分析並回答下列問題:
(1)學習時間與考試成績的相關系數是多少,考試成績的惡化有多少是學習時間的變化造成的?86.21% 74.32%
(2)根據EXCEL回歸輸出的結果,寫出估計的回歸方程,說明回歸系數的實際意義。
(3)檢驗線性關系的顯著性。
(4)根據標準化殘差圖,判斷關於隨機誤差項正態分布的假設是否成立。
標準化殘差分布在-2和2之間,所以隨機誤差項服從正態分布的假設成立。
3.隨機抽取15大型商場銷售的同類產品相關數據(單位:元),用EXCEL對結果進行回歸。下表顯示結果:(***15分)。
匯總輸出
回歸統計
倍數R 0.593684
r平方0.35246
調整後的R平方0.244537
標準誤差69.75121
觀察值15
方差分析
顯著性F
回歸分析231778.654338+0515 5438366
剩余12 58382.78 4865.232
總計14 90160.93
系數標準誤差t統計P值
截距375.6018288 339.410562 1.10662976 0.290145025
x變量1 0.537840951 0.21044674 2.5571054 0.02519961
x變量2 1.457193542 0.667706586 2.18238606 0.049681066
相關系數矩陣
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 0.8528576 1
註:X變量1為買入價/元。
x變量2是銷售費用/元。
因變量y為銷售價格/元。
(1)指出Y和X1以及Y和X2之間的相關系數。有沒有證據證明進價、售價、銷售費用之間存在線性關系?0.3089 0.0012沒有,因為相關系數小。
(2)根據申訴結果,妳認為用進價和銷售費用來預測有用嗎?無效的
(3)根據EXCEL回歸輸出的結果,寫出估計的回歸方程,檢驗線性關系是否顯著()。不顯著
(4)解釋決定系數R2。結論與問題(2)壹致嗎?R2=35.25%。在銷售價格的總變異中,用估計回歸方程解釋的比例為35.25%,兩者是壹致的。(+3)
(5)x 1與X2的相關系數是多少?這是什麽意思?高度相關
(6)模型中是否存在多重* * *線性?對模型有什麽特別的建議嗎?可能有多個* * *線性;進壹步檢驗是否存在多重* * *線性,檢驗X1與X2的樣本相關系數的顯著性(rx1x2=-0.8529)。如果顯著,則可以確定存在多重* * *線性。(+2)
對模型的建議:根據研究目的,刪除相對次要的解釋變量。(+1)
4.以下某公司生產的三種產品的數據如下表所示(***14分):
商品單價計量單位銷售量(萬元)
2005, 2006, 2005, 2006
壹公斤400 480 0.8 0.82
b噸80 88 1.15 1.05
C部分50 60 1.20 1.38
(1)計算三種產品的銷售指數;
(2)計算三種產品的銷售指數;
(3)計算三種產品的單價指數;
(4)計算分析產量和單價變化對銷售影響的相對數和絕對數。
北京信息科技大學
2007-2008學年第壹學期
統計學課程(A卷)期末試卷標準答案
壹、選擇題(此大題為* * 15小題,每個小題為1分,* * 15分)
每個問題所列的四個選項中,只有壹個符合題目要求。請在題目後的括號內填寫其代碼。錯選、多選或不選都不計分。
1.(壹)2。(壹)3。(C) 4。(A) 5。(四)
6.第七條第壹款第八項第二款第九項。(C) 10。(二)
11.12。(A) 13。(C) 14。15。(三)
二、選擇題(每小題2分,***16分)
每個問題所列的五個選項中,有兩到五個符合題目要求。請將正確選項前的字母放在題目後的括號內。多選、少選、錯選都是沒有分數的。
1.(ADEF)。(安倍)3。(ABD ) 4。(阿蔔杜勒)5。(美國廣播公司)
6.(公元前)7年。(CDE)。(CE)
三、簡答題(本大題***2題,每題5分,***10分)
1.年化增長率是多少?有什麽用?
(1)當增長率用年表示時,稱為年化增長率或年率,(+2)
其計算公式為:
m是壹年中的周期數;n是跨度的總數。
季度增長率年化時,m = 4。
月增長率年化時,m = 12。
當m = n時,上式為年增長率(+2)。
(2)可以將月度增長率或季度增長率轉換為年度增長率,以實現增長率之間的可比性。(+1)
2.數值型數據的分組方法有哪些?簡述組間距分組的步驟。
(1)可分為單變量值分組和組距分組兩種分組方式。
單變量值分組:以壹個變量值為壹組;適用於離散變量;適用於變量值很少的情況(+1)
組間距分組:以壹個變量值的區間為壹組;適用於連續變量;適用於變量值較多的情況;需要遵循“不重不漏”的原則;可以使用等長分組或不等長分組。(+1)
(2) A .確定組數:
(+1)
b確定組距:類寬是壹個組的上限和下限之差,可以根據所有數據的最大值和最小值以及劃分的組數(+1)來確定。
c .統計每組的頻率,並將其排列成頻率分布表。(+1)
四。是非題(這個大題是***5個小題,每個小題是1分,還有***5分)
1.當相關系數為+1時,兩個變量完全相關,當相關系數為-1時,兩個變量不相關。(×)
2.如果各種商品價格平均上漲5%,銷量平均下降5%,銷售指數不變。(×)
3.連續變量和離散變量按組間距分組時,可通過相鄰組的組間距重疊來確定組限。(√)
4.根據建立的線性回歸方程,我們無法判斷兩個變量之間的相關程度的緊密程度。(√)
5.設p代表單位成本,q代表產量,那麽∑p1q1—∑p0q1代表產品單位成本的變化對總產出的影響。(×)
動詞 (verb的縮寫)計算與分析題(***55分)
中位數位置:(10+1)/2=5.5。
中位數
從偏度的角度描述數據的分布形態:均值>中位數,正(右)偏。
(+2)
2.(1)學習時間與考試成績的相關系數是多少,考試成績的惡化有多少是學習時間的變化造成的?
r=0.862109,(+1)
R2=0.743232,而74.3232%的考試成績的惡化是由學習時間的變化引起的。(+2)
(2)根據EXCEL回歸輸出的結果,寫出估計的回歸方程,說明回歸系數的實際意義。
(+3)
回歸系數的含義是學習時間每增加壹小時,考試成績平均增加1.497分。(+2)
(3)檢驗線性關系的顯著性
顯著性F = 0.005895457÷5%
線性關系是重要的。(+3)
(4)根據標準化殘差圖判斷隨機誤差項服從正態分布的假設是否成立。
標準化殘差分布在-2和2之間,所以隨機誤差項服從正態分布的假設成立。(+4)
3.(1)指出Y和X1以及Y和X2之間的相關系數。有沒有證據證明進價、售價、銷售費用之間存在線性關系?
(1)ryxi = 0.308952067 ry x2 = 0.001214062,
沒有證據。(+2)
(2)根據以上結果,妳認為用進價和銷售費用來預測有用嗎?
沒用(+2)
(3)根據EXCEL回歸輸出的結果,寫出估計的回歸方程,檢驗線性關系是否顯著()。
顯著性F = 0.073722 & gt=5%
線性關系並不顯著。(+3)
(4)解釋決定系數R2,看看結論是否與問題(2)壹致。
R2=35.25%。在銷售價格的總變異中,用估計回歸方程解釋的比例為35.25%,兩者是壹致的。(+3)
(5)x 1與X2的相關系數是多少?這是什麽意思?
Rx1x2=-0.8529,高度相關(+2)。
(6)模型中是否存在多重* * *線性?對模型有什麽特別的建議嗎?
可能有多個* * *線性;進壹步檢驗是否存在多重* * *線性,檢驗X1與X2的樣本相關系數的顯著性(rx1x2=-0.8529)。如果顯著,則可以確定存在多重* * *線性。(+2)
對模型的建議:根據研究目的,刪除相對次要的解釋變量。(+1)
4.(1)三款產品銷售指數;(+3)
三個產品的銷售指數=∑q1p1/∑q0p0。
=568.8/472=120.51%
∑q 1p 1-∑q0p 0 = = 568.8-472 = 96.8萬元。
(2)三種產品的銷售指標;(+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
= 557.2-472 = 85.2萬元
(三)三種產品的價格指數;(+3)
IP =∑q 1p 1/∑q 1p 0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6萬元
(4)分析產量和單價變化對銷售影響的相對數和絕對數。(+5)
120.51%=118.05%*102.08% (+3)
96.8萬元= 85.2萬元+11.6萬元(+2)