一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.分析人的身高与体重的关系,可以用( ) A.残差分析 C.等高条形图
B.回归分析 D.独立性检验
解析: 因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 答案: B
2.如果有95%的把握说事件A和B有关系,那么具体计算出的数据( ) A.k>3.841 C.k>6.635
B.k<3.841 D.k<6.635
解析: 由独立性判断的方法可知,如果有95%的把握,则k>3.841. 答案: A
3.分类变量X和Y的列联表如下:
X1 X2 总计 则下列说法正确的是( ) Y1 a c a+c Y2 b d b+d 总计 a+b c+d a+b+c+d A.ad-bc越小,说明X与Y关系越弱 B.ad-bc越大,说明X与Y关系越强 C.(ad-bc)越大,说明X与Y关系越强 D.(ad-bc)越接近于0,说明X与Y关系越强
22
nad-bc22
解析: 因为k=,当(ad-bc)越大时,k越大,
a+ba+cb+dc+d
说明X与Y关系越强.
答案: C
4.已知x与y之间的一组数据:
x y ∧
∧∧0 1 1 3 2 5 3 7 则y与x的线性回归方程y=bx+a必过点是( )
1
A.(2,2) C.(1,2)
B.(1.5,0) D.(1.5,4)
解析: y与x的线性回归方程必过样本点的中心(1.5,4). 答案: D
5.考察人的高血压病是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:
是否患高血压 喜欢食物情况 喜欢较咸食物 喜欢清淡食物 合计 患高血压 34 26 60 未患高血压 220 1 353 1 573 合计 254 1 379 1 633 则认为人的高血压病与食盐摄入量有关的把握大约为( ) A.99% C.90%
B.95% D.无充分依据
2
1 633×34×1 353-26×220
解析: k=≈80.155,
254×1 379×60×1 573∵80.155>6.635,
∴有99%的把握认为人的高血压病与食盐摄入量有关. 答案: A
6.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K≈0.99,根据这一数据分析,下列说法正确的是( )
A.有99%的人认为栏目优秀
B.有99%的人认为栏目是否优秀与改革有关系 C.有99%的把握认为电视栏目是否优秀与改革有关系 D.没有理由认为电视栏目是否优秀与改革有关系
解析: 由于K=0.99<2.706,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.
答案: D
∧
22
7.已知一个线性回归方程为y=1.5x+45,其中x的取值依次为1,7,5,13,19,则y=( )
A.58.5 C.60 解析: x=
B.46.5 D.75
1+7+5+13+19
=9,因为回归直线方程过点(x,y),所以y=
5
2
1.5×x+45=1.5×9+45=58.5.
答案: A
∧
8.设有一个回归直线方程y=2-1.5x,则变量x每增加1个单位时( ) A.y平均增加1.5个单位 C.y平均减少1.5个单位
∧
B.y平均增加2个单位 D.y平均减少2个单位
解析: 回归直线方程y=2-1.5x中斜率为-1.5,它的含义是:x每增加1个单位时,
y平均减少1.5个单位.
答案: C
9.对于随机变量K的观测值k>2.706,我们就有________的把握认为x与y有关系( )
A.99% C.90%
2
2
B.95% D.以上都不对
解析: 由临界表得P(K≥2.706)=0.1,故我们有90%的把握认为x与y有关系. 答案: C 10.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数R来刻画回归的效果,R值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
其中错误命题的个数是( ) A.0 C.2
B.1 D.3
2
2
解析: 观察残差图,残差点比较均匀地落在水平的带状区域内,说明选用模型比较理想,故①正确;相关指数R的值越大,模型的拟合效果越好,故②正确;研究残差平方和时,其值越小,模型的拟合效果越好,故③正确.故答案选A.
答案: A
11.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
2
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 以下数据中,对于同一样本能说明X与Y有关的可能性最大的一组为( )
3
A.a=5,b=4,c=3,d=2 C.a=2,b=3,c=4,d=5
B.a=5,b=3,c=4,d=2 D.a=2,b=3,c=5,d=4
解析: 可计算|ad-bc|的值,值越大说明X与Y有关的可能性越大. 答案: D
12.两个相关变量满足如下关系
x y 10 1 003 15 1 005 20 1 010 25 1 011 30 1 014 两变量的线性回归方程为( ) ∧
∧
A.y=0.56x+997.4
∧
B.y=0.63x-231.2
∧
C.y=50.2x+501.4
5
D.y=60.4x+400.7
xiyi-5xy∧
i=1
∧
5
∧
解析: 利用公式b=
i-5xx2i=1
2
≈0.56,a=y-bx≈997.4.
∧
∴线性回归方程为y=0.56x+997.4. 答案: A
二、填空题(本大题共4小题,每小题4分,共16分.把正确的答案填在题中的横线上) 13.根据如图所示的等高条形图回答,吸烟与患肺病________关系.(“有”或“没有”)
解析: 本题考查用等高条形图来分析“两分类变量”之间的关系. 答案: 有
11
11
∧
∧
14.已知样本数为11,计算得xi=510,yi=214,回归方程为y=0.3x+a,则xi=1
i=1
∧
≈________,a≈________.(精确到0.01)
∧111510111214
解析: 由题意,x=xi=≈46.36,y=yi=,因为y=0.3x+a,
11i=11111i=111
∧
214510∧
所以=0.3×+a,可求得a≈5.55.
1111
4
答案: 46.36 5.55
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电
∧
∧
∧
∧
量与当天气温,并制作了对照表,由表中数据得线性回归方程y=bx+a,其中b=-2.现预测当天气温为-4 ℃时,用电量的度数约为________.
用电量y(度) 气温x(℃) 解析: 由题意可知 24 18 34 13 38 10 64 -1 x=(18+13+10-1)=10, y=(24+34+38+64)=40,
∧
1414
b=-2.
∧
∧
∧
又回归方程y=-2x+a过点(10,40),故a=60,
∧
所以当x=-4时,y=-2×(-4)+60=68. 答案: 68
16.若两个分类变量X与Y的列联表为:
x1 x2 总 计 y1 10 40 50 y2 15 16 31 总 计 25 56 81 则“X与Y之间有关系”这个结论出错的概率为________. 解析: 由列联表数据,可求得随机变量K的观测值
81×10×16-40×152k=≈7.227>6.635.因为P(K≥6.635)≈0.01.所以“x与y25×56×50×31之间有关系”出错的概率仅为0.01.
答案: 0.01
三、解答题(本大题共6小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.
解析: 根据题中数据得如下列联表:
2
2
及格 不及格 总计 5
男生 女生 总计 2290 100 390 160 350 510 450 450 900 由列联表中的数据得K的观测值为 900×290×350-100×160k=≈163.348>10.828,所以在犯错误的概率不超过
450×450×390×5100.001的前提下认为“这一高考试题的得分情况与性别有关系.”
18.(本小题满分12分)某产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
2
x y 2 30 4 40 5 60 6 50 8 70 请画出散点图并用散点图粗略地判断x、y是否线性相关. 解析: 散点图如图.
从散点图可以看出散点呈条状分布,所以x、y具有较强的线性相关关系.
19.(本小题满分12分)已知10只狗的血球体积x(单位:mm)及红血球数y(单位:百万)的测量值如下: 血球体积45 42 46 48 42 35 58 40 39 50 3
x/mm 红血球数3y/百万 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72 (1)画出散点图; (2)求出y对x的回归直线方程;
(3)若血球体积为49 mm,预测红血球数大约是多少. 解析: (1)散点图如图所示.
3
6
∧∧∧
(2)设线性回归方程为y=bx+a, 由表中数据代入公式,得
10
xi-x∧
yi-y
∧
∧
i=1
b=
10
≈0.16,a=y-bx≈0.12.
xi-xi=1
2
∧
所以所求线性回归方程为y=0.16x+0.12.
∧
(3)把x=49代入线性回归方程,得y=0.16×49+0.12=7.96(百万),计算结果表明,当血球体积为49 mm时,红血球数大约为7.96百万.
20.(本小题满分12分)(2013·琼海高二检测)为了调查某地区老年人是否需要志愿者帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别 是否需要帮助 需要 不需要 总计 男 40 160 200 女 30 270 300 总计 70 430 500 3
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?
附:
P(K2≥k) k 2
0.050 3.841 0.010 6.635 0.001 10.828 nad-bc2K=.
a+bc+da+cb+d
70
解析: (1)需要帮助的老年人的比例估计值为×100%=14%.
500500×40×270-30×160(2)k=≈9.967>6.635.
200×300×70×430因为P(K≥6.635)≈0.010,
所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.
21.(本小题满分13分)(2012·辽宁卷)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查
2
2
7
结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
男 女 合计 2
非体育迷 体育迷 10 合计 55 nad-bc2附:K=,
a+bc+da+cb+d
P(K2≥k) k 0.05 3.841 0.01 6.635 解析: 由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而得2×2列联表如下:
男 女 合计 非体育迷 30 45 75 体育迷 15 10 25 合计 45 55 100 将2×2列联表中的数据代入公式计算,得 2
nad-bc2100×30×10-45×15100
K===≈3.030.
a+bc+da+cb+d75×25×45×55332
因为3.030<3.841,所以没有理由认为“体育迷”与性别有关.
22.(本小题满分13分)下表提供了某厂生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x y 3 2.5 4 3 5 4 6 4.5 ∧
∧
∧
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a; (2)请求出R,并说明残差变量对预报变量的影响约占百分之几.
8
2
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
4
4
解析: (1)x2
32
+42
+52
+62
iyi=66.5,xi==86,
i=1
i=1
x=4.5,y=3.5,
∧
b=
66.5-4×4.5×3.586-4×4.52
=66.5-63
86-81
=0.7, ∧
∧
a=y-bx=3.5-0.7×4.5=0.35,
∧
所求的线性回归方程为y=0.7x+0.35. (2)计算得残差及偏差的数据如下表:
∧yi-yi 0.05 -0.15 0.15 -0.05 yi-y -1 -0.5 0.5 1 4
∧
4
从而得 (y2
2
i-yi)=0.05, (yi-y)=2.5,
i=1i=1
4∧
y2
i-yii=1
所以R2
=1-
=1-0.05
4
2.5=0.98.
yi-y
2
i=1
所以残差变量对预报变量的贡献率约为2%.
9
因篇幅问题不能全部显示,请点此查看更多更全内容