您的当前位置:首页正文

2016-2017学年高中数学第一章统计案例章末高效整合新人教A版选修1-2资料

2022-08-07 来源:爱够旅游网
第一章 统计案例

一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)

1.分析人的身高与体重的关系,可以用( ) A.残差分析 C.等高条形图

B.回归分析 D.独立性检验

解析: 因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 答案: B

2.如果有95%的把握说事件A和B有关系,那么具体计算出的数据( ) A.k>3.841 C.k>6.635

B.k<3.841 D.k<6.635

解析: 由独立性判断的方法可知,如果有95%的把握,则k>3.841. 答案: A

3.分类变量X和Y的列联表如下:

X1 X2 总计 则下列说法正确的是( ) Y1 a c a+c Y2 b d b+d 总计 a+b c+d a+b+c+d A.ad-bc越小,说明X与Y关系越弱 B.ad-bc越大,说明X与Y关系越强 C.(ad-bc)越大,说明X与Y关系越强 D.(ad-bc)越接近于0,说明X与Y关系越强

22

nad-bc22

解析: 因为k=,当(ad-bc)越大时,k越大,

a+ba+cb+dc+d

说明X与Y关系越强.

答案: C

4.已知x与y之间的一组数据:

x y ∧

∧∧0 1 1 3 2 5 3 7 则y与x的线性回归方程y=bx+a必过点是( )

1

A.(2,2) C.(1,2)

B.(1.5,0) D.(1.5,4)

解析: y与x的线性回归方程必过样本点的中心(1.5,4). 答案: D

5.考察人的高血压病是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:

是否患高血压 喜欢食物情况 喜欢较咸食物 喜欢清淡食物 合计 患高血压 34 26 60 未患高血压 220 1 353 1 573 合计 254 1 379 1 633 则认为人的高血压病与食盐摄入量有关的把握大约为( ) A.99% C.90%

B.95% D.无充分依据

2

1 633×34×1 353-26×220

解析: k=≈80.155,

254×1 379×60×1 573∵80.155>6.635,

∴有99%的把握认为人的高血压病与食盐摄入量有关. 答案: A

6.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K≈0.99,根据这一数据分析,下列说法正确的是( )

A.有99%的人认为栏目优秀

B.有99%的人认为栏目是否优秀与改革有关系 C.有99%的把握认为电视栏目是否优秀与改革有关系 D.没有理由认为电视栏目是否优秀与改革有关系

解析: 由于K=0.99<2.706,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.

答案: D

22

7.已知一个线性回归方程为y=1.5x+45,其中x的取值依次为1,7,5,13,19,则y=( )

A.58.5 C.60 解析: x=

B.46.5 D.75

1+7+5+13+19

=9,因为回归直线方程过点(x,y),所以y=

5

2

1.5×x+45=1.5×9+45=58.5.

答案: A

8.设有一个回归直线方程y=2-1.5x,则变量x每增加1个单位时( ) A.y平均增加1.5个单位 C.y平均减少1.5个单位

B.y平均增加2个单位 D.y平均减少2个单位

解析: 回归直线方程y=2-1.5x中斜率为-1.5,它的含义是:x每增加1个单位时,

y平均减少1.5个单位.

答案: C

9.对于随机变量K的观测值k>2.706,我们就有________的把握认为x与y有关系( )

A.99% C.90%

2

2

B.95% D.以上都不对

解析: 由临界表得P(K≥2.706)=0.1,故我们有90%的把握认为x与y有关系. 答案: C 10.有下列说法:

①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数R来刻画回归的效果,R值越大,说明模型的拟合效果越好;

③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.

其中错误命题的个数是( ) A.0 C.2

B.1 D.3

2

2

解析: 观察残差图,残差点比较均匀地落在水平的带状区域内,说明选用模型比较理想,故①正确;相关指数R的值越大,模型的拟合效果越好,故②正确;研究残差平方和时,其值越小,模型的拟合效果越好,故③正确.故答案选A.

答案: A

11.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为:

2

x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 以下数据中,对于同一样本能说明X与Y有关的可能性最大的一组为( )

3

A.a=5,b=4,c=3,d=2 C.a=2,b=3,c=4,d=5

B.a=5,b=3,c=4,d=2 D.a=2,b=3,c=5,d=4

解析: 可计算|ad-bc|的值,值越大说明X与Y有关的可能性越大. 答案: D

12.两个相关变量满足如下关系

x y 10 1 003 15 1 005 20 1 010 25 1 011 30 1 014 两变量的线性回归方程为( ) ∧

A.y=0.56x+997.4

B.y=0.63x-231.2

C.y=50.2x+501.4

5

D.y=60.4x+400.7

xiyi-5xy∧

i=1

5

解析: 利用公式b=

i-5xx2i=1

2

≈0.56,a=y-bx≈997.4.

∴线性回归方程为y=0.56x+997.4. 答案: A

二、填空题(本大题共4小题,每小题4分,共16分.把正确的答案填在题中的横线上) 13.根据如图所示的等高条形图回答,吸烟与患肺病________关系.(“有”或“没有”)

解析: 本题考查用等高条形图来分析“两分类变量”之间的关系. 答案: 有

11

11

14.已知样本数为11,计算得xi=510,yi=214,回归方程为y=0.3x+a,则xi=1

i=1

≈________,a≈________.(精确到0.01)

∧111510111214

解析: 由题意,x=xi=≈46.36,y=yi=,因为y=0.3x+a,

11i=11111i=111

214510∧

所以=0.3×+a,可求得a≈5.55.

1111

4

答案: 46.36 5.55

15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电

量与当天气温,并制作了对照表,由表中数据得线性回归方程y=bx+a,其中b=-2.现预测当天气温为-4 ℃时,用电量的度数约为________.

用电量y(度) 气温x(℃) 解析: 由题意可知 24 18 34 13 38 10 64 -1 x=(18+13+10-1)=10, y=(24+34+38+64)=40,

1414

b=-2.

又回归方程y=-2x+a过点(10,40),故a=60,

所以当x=-4时,y=-2×(-4)+60=68. 答案: 68

16.若两个分类变量X与Y的列联表为:

x1 x2 总 计 y1 10 40 50 y2 15 16 31 总 计 25 56 81 则“X与Y之间有关系”这个结论出错的概率为________. 解析: 由列联表数据,可求得随机变量K的观测值

81×10×16-40×152k=≈7.227>6.635.因为P(K≥6.635)≈0.01.所以“x与y25×56×50×31之间有关系”出错的概率仅为0.01.

答案: 0.01

三、解答题(本大题共6小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)

17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.

解析: 根据题中数据得如下列联表:

2

2

及格 不及格 总计 5

男生 女生 总计 2290 100 390 160 350 510 450 450 900 由列联表中的数据得K的观测值为 900×290×350-100×160k=≈163.348>10.828,所以在犯错误的概率不超过

450×450×390×5100.001的前提下认为“这一高考试题的得分情况与性别有关系.”

18.(本小题满分12分)某产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:

2

x y 2 30 4 40 5 60 6 50 8 70 请画出散点图并用散点图粗略地判断x、y是否线性相关. 解析: 散点图如图.

从散点图可以看出散点呈条状分布,所以x、y具有较强的线性相关关系.

19.(本小题满分12分)已知10只狗的血球体积x(单位:mm)及红血球数y(单位:百万)的测量值如下: 血球体积45 42 46 48 42 35 58 40 39 50 3

x/mm 红血球数3y/百万 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72 (1)画出散点图; (2)求出y对x的回归直线方程;

(3)若血球体积为49 mm,预测红血球数大约是多少. 解析: (1)散点图如图所示.

3

6

∧∧∧

(2)设线性回归方程为y=bx+a, 由表中数据代入公式,得

10

 xi-x∧

yi-y

i=1

b=

10

≈0.16,a=y-bx≈0.12.

 xi-xi=1

2

所以所求线性回归方程为y=0.16x+0.12.

(3)把x=49代入线性回归方程,得y=0.16×49+0.12=7.96(百万),计算结果表明,当血球体积为49 mm时,红血球数大约为7.96百万.

20.(本小题满分12分)(2013·琼海高二检测)为了调查某地区老年人是否需要志愿者帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:

性别 是否需要帮助 需要 不需要 总计 男 40 160 200 女 30 270 300 总计 70 430 500 3

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?

附:

P(K2≥k) k 2

0.050 3.841 0.010 6.635 0.001 10.828 nad-bc2K=.

a+bc+da+cb+d

70

解析: (1)需要帮助的老年人的比例估计值为×100%=14%.

500500×40×270-30×160(2)k=≈9.967>6.635.

200×300×70×430因为P(K≥6.635)≈0.010,

所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.

21.(本小题满分13分)(2012·辽宁卷)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查

2

2

7

结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?

男 女 合计 2

非体育迷 体育迷 10 合计 55 nad-bc2附:K=,

a+bc+da+cb+d

P(K2≥k) k 0.05 3.841 0.01 6.635 解析: 由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而得2×2列联表如下:

男 女 合计 非体育迷 30 45 75 体育迷 15 10 25 合计 45 55 100 将2×2列联表中的数据代入公式计算,得 2

nad-bc2100×30×10-45×15100

K===≈3.030.

a+bc+da+cb+d75×25×45×55332

因为3.030<3.841,所以没有理由认为“体育迷”与性别有关.

22.(本小题满分13分)下表提供了某厂生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.

x y 3 2.5 4 3 5 4 6 4.5 ∧

(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a; (2)请求出R,并说明残差变量对预报变量的影响约占百分之几.

8

2

(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)

4

4

解析: (1)x2

32

+42

+52

+62

iyi=66.5,xi==86,

i=1

i=1

x=4.5,y=3.5,

b=

66.5-4×4.5×3.586-4×4.52

=66.5-63

86-81

=0.7, ∧

a=y-bx=3.5-0.7×4.5=0.35,

所求的线性回归方程为y=0.7x+0.35. (2)计算得残差及偏差的数据如下表:

∧yi-yi 0.05 -0.15 0.15 -0.05 yi-y -1 -0.5 0.5 1 4

4

从而得 (y2

2

i-yi)=0.05, (yi-y)=2.5,

i=1i=1

4∧

 y2

i-yii=1

所以R2

=1-

=1-0.05

4

2.5=0.98.

 yi-y

2

i=1

所以残差变量对预报变量的贡献率约为2%.

9

因篇幅问题不能全部显示,请点此查看更多更全内容