题 专题 07 统计
【要点提炼】
1.抽样方法 抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x-= 1n (x 1 +x 2 +„+x n ). (4)方差与标准差. s 2 = 1n [(x 1 -x-) 2 +(x 2 -x-) 2 +„+(x n -x-) 2 ], s=1n [(x 1 -x-)
2 +(x 2 -x-)
2 +„+(x n -x-)
2 ]. 3.直方图的两个结论 (1)小长方形的面积=组距× 频率组距 =频率. (2)各小长方形的面积之和等于 1. 4.回归分析与独立性检验 (1)回归直线y^=b^x+a^经过样本点的中心(x-,y-),若 x 取某一个值代入回归直线方程y^=b^x+a^中,可求出 y 的估计值. (2)独立性检验 对于取值分别是{x 1 ,x 2 }和{y 1 ,y 2 }的分类变量 X 和 Y,其样本频数列联表是:
y 1
y 2
总计 x 1
a b a+b x 2
c d c+d 总计 a+c b+d n 则 K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
(其中 n=a+b+c+d 为样本容量).
考点 考向一 抽样方法 【典例 1】
(1)总体由编号为 01,02,„,49,50 的 50 个个体组成,利用下面的随机数表选取 6 个个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数字,则选出的第 4 个个体的编号为(
) 附:第 6 行至第 9 行的随机数表 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 3211 4919 7306 4916 7677 8733 9974 6732 2635 7900 3370 9160 1620 3882 7757 4950 A.3
B.19
C.38
D.20 (2)(2020·百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高一、高二、高三共有学生 1 800 名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这 1 800 名学生中抽取一个容量为 72 的样本.若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为(
) A.800
B.750
C.700
D.650 解析 (1)由题意知,编号为 01~50 的个体才是需要的个体.由随机数表依次可得41,48,28,19,16,20,„„故第 4 个个体的编号为 19.故选 B. (2)设从高三年级抽取的学生人数为 2x 人,则从高二、高一年级抽取的人数分别为 2x-2,2x-4. 由题意可得 2x+(2x-2)+(2x-4)=72,∴x=13. 设我校高三年级的学生人数为 N,且高三抽取 26 人, 由分层抽样,得N1 800 =2672 ,∴N=650(人). 答案 (1)B (2)D 探究提高 解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值. 【拓展练习 1】
(1)总体由编号为 01,02,„,19,20 的 20 个个体组成.利用下
面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行第 6 列的数字开始,由左到右依次选取两个数字,则选出来的第 5 个个体的编号为________. 附:第 1 行至第 2 行的随机数表 21 16 65 08 90 34 20 76 43 81 26 34 91 64 17 50 71 59 45 06 91 27 35 36 80 72 74 67 21 33 50 25 83 12 02 76 11 87 05 26 (2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60件进行检验,则应从丙种型号的产品中抽取________件. 解析 (1)从随机数表的第 1 行第 6 列的数字开始,按规则得到的编号依次为 50,89,03,42,07,64,38,12,63,49,16,41,75,07,15,94,50,„„其中编号在 01 至 20 之间的依次为 03,07,12,16,07,15,„„按照编号重复的删除后一个的原则,可知选出来的第 5 个个体的编号为 15. (2)因为样本容量 n=60,总体容量 N=200+400+300+100=1 000,所以抽取比典例为 nN =601000 =350 . 因此应从丙种型号的产品中抽取 300×350 =18(件). 答案 (1)15 (2)18 考向二 用样本估计总体 角度 1 数字特征与统计图表的应用 【典例 2】
(1)(2020·衡水检测)甲、乙两名同学高三以来 6 次数学模拟考试的成绩统计如下图,甲、乙两组数据的平均数分别为x-甲 、x-乙 ,标准差分别为 s 甲 、s 乙 ,则(
)
A.x-甲 <x-乙 ,s 甲 <s 乙
B.x-甲 <x-乙 ,s 甲 >s 乙
C.x-甲 >x-乙 ,s 甲 <s 乙
D.x-甲 >x-乙 ,s 甲 >s 乙
(2)2020 年初,我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层抽样的方法抽取 4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为(
)
A.2 750,200
B.2 750,110 C.1 120,110
D.1 120,200 解析 (1)由统计图知,甲同学的总体成绩要好于乙同学的成绩,且乙同学的成绩波动较大,甲同学成绩较稳定.∴x-甲 >x-乙 ,且 s 甲 <s 乙 .
(2)学生总数为 15 500+5 000+7 500=28 000 人,由于抽取 4%的学生进行调查,则抽取的样本容量为 28 000×4%=1 120(人).故高中生应抽取的人数为 5 000×4%=200(人),而高中生中参与“家务劳动”的比率为 0.55,故高中生中参与“家务劳动”的人数为 200×0.55=110(人). 答案 (1)C (2)C 角度 2 用样本的频率分布估计总体分布 【典例 3】
(2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C)的估计值为 0.70. (1)求乙离子残留百分比直方图中 a,b 的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 解 (1)由已知得 0.70=a+0.20+0.15, 故 a=0.35, b=1-0.05-0.15-0.70=0.10. (2)甲离子残留百分比的平均值的估计值为 2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为 3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00. 探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小. 2.在典例 3 中,抓住频率分布直方图各小长方形的面积之和为 1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错. 【拓展练习 2】
(1)(2020·新高考海南卷)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续 11 天复工复产指数折线图,下列说法正
确的是(
)
A.这 11 天复工指数和复产指数均逐日增加 B.这 11 天期间,复产指数增量大于复工指数的增量 C.第 3 天至第 11 天复工复产指数均超过 80% D.第 9 天至第 11 天复产指数增量大于复工指数的增量 解析 由图可知,第 1 天到第 2 天复工指数减少,第 7 天到第 8 天复工指数减少,第 10 天到第 11 天复工指数减少,第 8 天到第 9 天复产指数减少,故 A 错误;由图可知,第一天的复产指数与复工指数的差大于第 11 天的复产指数与复工指数的差,所以这 11 天期间,复产指数增量小于复工指数的增量,故 B 错误;由图可知,第 3 天至第 11 天复工复产指数均超过 80%,故 C 正确;由图可知,第9 天至第 11 天复产指数增量大于复工指数的增量,故 D 正确;故选 C、D. 答案 CD (2)(2019·全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了 100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表. y 的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80] 企业数 2 24 53 14 7 ①分别估计这类企业中产值增长率不低于 40%的企业比典例、产值负增长的企业比典例; ②求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到 0.01)附:
74≈8.602. 解 ①根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低于40%的企业频率为 14+7100=0.21. 产值负增长的企业频率为2100 =0.02.
所以用样本频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比典例为 21%,产值负增长的企业比典例为 2%. ②100 个企业的产值增长率平均数为 y-=1100 ×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2 =1100 ∑5i = 1 n i (y i -y-) 2 =1100 ×[(-0.40)2 ×2+(-0.20) 2 ×24+0 2 ×53+0.20 2 ×14+0.40 2 ×7]=0.029 6, s= 0.029 6=0.02× 74≈0.17. 所以,这类企业产值增长率的平均数与标准差的估计值分别为 0.30,0.17. 考向三 回归分析在实际问题中的应用 【典例 4】
如图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图.
为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型.根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,„,17)建立模型①:y^=-30.4+13.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,„,7)建立模型②:y^=99+17.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解 (1)利用模型①,该地区 2018 年的环境基础设施投资额的预测值为y^=-30.4+13.5×19=226.1(亿元). 利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线y=-30.4+13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠. (ⅱ)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型①得到的预测值 226.1 亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b^,a^的计算公式和准确地计算. (2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数 (1)当 r>0 时,表明两个变量正相关;当 r<0 时,两个变量负相关. (2)当|r|>0.75 时,认为两个变量具有较强的线性相关关系. 【拓展练习 3】
(1)(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:℃)的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i=1,2,„,20)得到下面的散点图:
由此散点图,在 10 ℃至 40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度 x 的回归方程类型的是(
)
A.y=a+bx
B.y=a+bx 2
C.y=a+be x
D.y=a+bln x (2)(2020·百强名校领军考试)已知变量 x,y 的关系可以用模型 y=ce kx 拟合,设 z=ln y,其变换后得到一组数据如下:
x 16 17 18 19 z 50 34 41 31 由上表可得线性回归方程z^=-4x+a^,则 c=(
) A.-4
B.e- 4
C.109
D.e 109
解析 (1)由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选 D. (2)由数据表知x-=17.5,z-=39. ∵样本点中心(x-,z-)在回归直线上, ∴a^=39+4×17.5=109. 又 z=ln y=ln(ce kx )=kx+ln c, ∴ln c=a^=109,则 c=e 109 . 答案 (1)D (2)D 考向四 独立性检验 【典例 5】
(2020·新高考山东、海南卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100 天空气中的 PM2.5 和 SO 2浓度(单位:μg/m 3 ),得下表:
SO 2
PM2.5
[0,50] (50,150] (150,475] [0,35] 32 18 4 (35,75] 6 8 12 (75,115] 3 7 10 (1)估计事件“该市一天空气中 PM2.5 浓度不超过 75,且 SO 2 浓度不超过 150”的概率; (2)根据所给数据,完成下面的 2×2 列联表:
SO 2
PM2.5
[0,150] (150,475] [0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO 2 浓度有关?
附:K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
, P(K 2 ≥k 0 ) 0.050 0.010 0.001 k 0
3.841 6.635 10.828 解 (1)根据抽查数据,该市 100 天的空气中 PM2.5 浓度不超过 75,且 SO 2 浓度不超过 150 的天数为 32+18+6+8=64,因此,该市一天空气中 PM2.5 浓度不超过 75,且 SO 2 浓度不超过 150 的概率的估计值为64100 =0.64. (2)根据抽查数据,可得 2×2 列联表:
SO 2
PM2.5
[0,150] (150,475] [0,75] 64 16 (75,115] 10 10 (3)根据(2)的列联表得 K 2 的观测值 k= 100×(64×10-16×10)280×20×74×26≈7.484. 由于 7.484>6.635,故有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO 2 浓度有关. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成 2×2 列联表; (2)根据公式 K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
,计算 K2的值; (3)查表比较 K 2 与临界值的大小关系,作统计判断. 2.K 2 的观测值 k 越大,对应假设事件 H 0 成立(两类变量相互独立)的概率越小,
H 0 不成立的概率越大. 【拓展练习 4】
某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意 不满意 男顾客 40 10 女顾客 30 20 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2 =n(ad-bc)
2(a+b)(c+d)(a+c)(b+d)
. P(K 2 ≥k 0 ) 0.050 0.010 0.001 k 0
3.841 6.635 10.828 解 (1)由调查数据,男顾客中对该商场服务满意的比率为 4050 =0.8,因此男顾客对该商场服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3050 =0.6,因此女顾客对该商场服务满意的概率的估计值为 0.6. (2)K 2 的观测值 k= 100×(40×20-30×10)250×50×70×30≈4.762. 由于 4.762>3.841,故有 95%的把握认为男、女顾客对该商场服务的评价有差异.
【 专题 拓展练习】
一、单选题 1.某实验室研发新冠疫苗,试验中需对 x , y 两项指标进行对照试验.已经进行的连续五次试验所测得的指标数据如下表:
x
110 115 120 125 130 y
85 89 90 92 94 已知 y 与 x 具有线性相关关系,利用上表中的五组数据求得回归直线方程为ˆˆ ˆ y bx a .根
据该回归方程,预测下一次试验中当 150 x 时, ˆ 106.2 y ,则 ˆb 的值为(
)
A.0.48 B.0.5 C.0.52 D.0.54 【答案】D 【详解】
由已知表格中的数据,求得:110 115 120 125 1301205x , 85 89 90 92 94905y ,则20 0ˆ1 9 ˆ b a ,① 又因为下一次实验中 150 x 时, ˆ 106.2 y ,则 150106.2ˆˆ b a ,② 联立①②,解得:
ˆ0.54 b . 故选:D. 2.根据如下样本数据:
x
2 3 4 5 6 y
4 2.5 0.5
2
3
得到的回归方程为 ybx a $ $ $ ,则(
)
A. 0a ,0 b B.0 a , ˆ0 b C. 0a ,0 b D.0 a , ˆ0 b 【答案】B 【详解】
由图表中的数据可得,变量 y 随着 x 的增大而减小,则 ˆ0 b , 2 3 4 5 645x ,4 2.5 0.5 2 30.25y , 又回归方程 ybx a $ $ $ 经过点 (4,0.2) ,可得0 a , 故选:B. 3.某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数 y 与当天气温 x 的回归方程2.352 147.767 y x .下列选项正确的是(
)
A. x 与 y 线性正相关 B. x 与 y 线性负相关 C. y 随 x 增大而增大 D. y 随 x 减小而减小 【答案】B 【详解】
由回归方程2.352 147.767 y x ,可得:
x 与 y 线性负相关,且 y 随 x 增大而减小. 故选:B 4.“二万五千里长征”是 1934 年 10 月到 1936 年 10 月中国工农红军进行的一次战略转移,是人类历史上的伟大奇迹,向世界展示了中国工农红军的坚强意志,在期间发生了许多可歌可泣的英雄故事.在中国共产党建党 100 周年之际,某中学组织了“长征英雄事迹我来讲”活动,已知该中学共有高中生 2700 名,用分层抽样的方法从该校高中学生中抽取一个容量为45 的样本参加活动,其中高三年级抽取了 14 人,高二年级抽取了 15 人,则该校高一年级学生人数为(
)
A.720 B.960 C.1020 D.1680 【答案】B 【详解】
由题意高一抽取的学生为 45 14 15 16 . 设高一学生数为 n ,则162700 45n ,解得 960 n . 故选:B. 5.数据1 2 10, , , x x x 的平均数为 1,则数据1 2 1010 1,10 2, ,10 10 x x x 的平均数为(
)
A.14.5 B.15.5 C.16.5 D.10 【答案】B 【详解】
数据1 2 10, , , x x x 的平均数为 1, 则数据1 2 1010 1,10 2, ,10 10 x x x 的平均数为: 1 210 1 10 2 10 1010nx x x 1 2 101 2 1010x x x
1 1010210 10 1 15.510x , 故选:B. 6.如图,根据已知的散点图,得到 y 关于 x 的线性回归方程为ˆ0.2 y bx ,则 ˆb (
)
A.1.5 B.1.8 C.2 D.1.6 【答案】D 【详解】
因为1 2 3 4 5 2 3 5 7 83, 55 5x y ,所以 53 0.2 b ,解得1.6 b. 故选:D. 7.为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率直方图.已知立定跳远 200cm 以上成绩为及格, 255cm 以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的优秀率和图中的 a 分别是是(
)
A.3%,0.010 B.3%,0.012 C.6%,0.010 D.6%,0.012 【答案】C 【详解】
由频率分布直方图可得,优秀率为 0.003 20 100% 6% ; 由 0.003 0.014 0.020 0.003 20 1 a ,解得 0.010 a ; 故选:C. 8.下列叙述错误的是(
)
A.若事件 A 发生的概率为( ) P A ,则 0 ( ) 1 P A
B.随机抽样都是不放回抽样,每个个体被抽到的可能性相等 C.线性回归直线ˆˆ ˆ y bx a 必过点 ( , ) x y
D.对于任意两个事件 A 和 B ,都有 ( ) ( ) ( ) P A B P A P B
【答案】D 【详解】
A 选项,根据概率的定义可得,若事件 A 发生的概率为 ( ) P A ,则 0 ( ) 1 P A ,A 正确; B 选项,根据随机抽样的定义可知,B 正确; C 选项,线性回归直线ˆˆ ˆ y bx a 必过样本中心点 ( , ) x y ,C 正确; D 选项,对于任意两个事件 A 和 B ,其和事件发生的概率公式为:( ) ( ) ( ) ( ) P A B P A P B P A B , 只有当事件 A 和 B 是互斥事件时,才有 ( ) ( ) ( ) P A B P A P B ,故 D 错误,
故选:D. 9.已知甲、乙两家企业 2020 年 1 至 10 月份的月收入情况统计如图所示,下列说法中不正确的是( )
A.甲企业的月收入比乙企业的月收入高 B.甲、乙两企业月收入差距的最大值在 7 月份 C.甲、乙两企业月收入差距的平均值为 350 万元 D. 10 月份与 6 月份相比,甲企业的月收入增长率比乙企业的月收入增长率低 【答案】C 【详解】
A 项,由图可知甲企业月收入数据比乙企业月收入数据都高,∴正确, B 项,由图可知甲、乙两企业月收入差距如下:
月份 1 2 3 4 5 6 7 8 9 10 差距/万元 200 300 200 100 300 300 600 400 300 300 显然差距的最大值在 7 月份,为 600 万元,正确, C 项,由上表可知,甲、乙两企业月收入差距的平均数为:
1(200 300 200 100 300 300 600 400 300 300) 30010 (万元),不正确, D 项, 10 月份与 6 月份相比,甲企业与乙企业的月收入都增加了 200 万元, 但甲企业 6 月份的收入为 600 万元,乙企业 6 月份的收入为 300 万元, ∴甲企业月收入的增长率比乙企业月收入的增长率低,正确, 故选:C.
10.利用随机数表法对一个容量为 500 编号为 000 、 001 、 002 、…、 499 的产品进行抽样检验,抽取一个容量为 10 的样本,若选定从第 12 行第 5 列的数开始向右读数,(下面摘取了随机数表中的第 11 行至第 15 行),根据下图,读出的第 3 个数是(
).
A. 016
B. 114
C. 146
D. 841
【答案】B 【详解】
最先读到的 1 个的编号是 389 ;向右读下一个数是 775 ,大于 499 ,舍, 再下一个数是 841 ,大于 499 ,舍;再下一个数是 607 ,大于 499 ,舍, 再下一个数是 499 ,再下一个数是 983 ,大于 499 ,大于 499 ,舍, 再下一个数是 114 ,读出的第 3 个数是 114 , 故选:B .
11.甲、乙两位同学最近五次模考数学成绩茎叶图如图,则平均分数较高和成绩比较稳定的分别是(
)
A.甲、甲 B.乙、甲 C.甲、乙 D.乙、乙 【答案】A 【详解】
由茎叶图可知,甲同学最近五次模考数学成绩的平均数为68 69 70 71 72705x 甲, 方差为 2 2 2 2 2268 70 69 70 70 70 71 70 72 7025s 甲,
乙同学最近五次模考数学成绩的平均数为63 68 69 69 71685x 乙, 方差为 2 2 2 2 2263 68 68 68 69 68 69 68 71 687.25s 乙, 则 x x 乙 甲,2 2s s 甲 乙 ,所以,平均分数较高的是甲,成绩较为稳定的是甲, 故选:A. 12.变量 x 、 y 具有线性相关关系,当 x 取值为 16 、 14 、 12 、 8 时,通过观测得到y 的值分别为 11 、 9 、 8 、 5 .若在实际问题中,预测当 10 y 时, x 的近似值为(
)
(参考公式:1221ˆni iiniix y n x ybx n x ,ˆây bx ) A. 14
B. 15
C. 16
D. 17
【答案】B 【详解】
由题意得:
12.5 x , 8.25 y ,1438ni iix y ,21660niix, 则0. 86ˆ72 b , 8.25 0.7286 12.5 0.857 ˆ 5 a , 故回归直线方程为 ˆ 0.7286 0.8575 y x , 得 14.90 15 x , 故选:B.
二、解答题 13.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取 100名试验者检验结果并评分(满分为 100 分),其中评分不低于 80 分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求 t 的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表); (2)将选取的 100 名试验者的性别与疫苗是否强力有效进行统计,请将下列 2×2 列联表补充完整,并能否判断在犯错误的概率不超过 0.05 的前提下认为疫苗的强效力与性别有关?
强力有效 效力一般 合计 男性
50 女性 10
合计
100 参考数据:
2P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 22n ad bcKa b c d a c b d ,其中 n a b c d . 【详解】
(1)由 0.005 0.020 0.025 0.030 0.005 10 1 t ,解得:
0.015 t
平均得分为 45 0.005 10 55 0.015 10 65 0.020 10 75 0.030 10
85 0.025 10 95 0.005 10 72
(2)由己知可得强力有效人数有 100 0.025 0.005 10 30 人, 则 2 2 列联表为:
强力有效 效力一般 合计 男性 20 30 50 女性 10 40 50 合计 30 70 100 2 22100 800 3004.762 3.84150 50 30 70n ad bcKa b c d a c b d 所以能在犯错误的概率不超过 0.05 的前提下认为疫苗强效力与性别有关. 14.某企业投资两个新型项目,投资新型项目 A 的投资额 m (单位:十万元)与纯利润 n (单位:万元)的关系式为 1.7 0.5 n m ,投资新型项目 B 的投资额 x (单位:十万元)与纯利润 y (单位:万元)的散点图如图所示.
(1)求 y 关于 x 的线性回归方程; (2)根据(1)中的回归方程,若 A , B 两个项目都投资 60 万元,试预测哪个项目的收益更好. 附:回归直线 ybx a $ $ $ 的斜率和截距的最小二乘估计分别为1221ni iiniix y nxybx nx,a y bx $ $.
【详解】
(1)由散点图可知, x 取 1,2,3,4,5 时, y 的值分别为 2,3,5,7,8 , 所以1 2 3 4 535x ,2 3 5 7 855y , 2 2 2 2 2 21 2 2 3 3 5 4 7 5 8 5 3 51.61 2 3 4 5 5 3b , 则5 1.6 3 0.2 a , 故 y 关于 x 的线性回归方程为1.6 0.2 y x . (2)因为投资新型项目 A 的投资额 m (单位:十万元)与纯利润 n (单位:万元)的关系式为 1.7 0.5 n m , 所以若 A 项目投资 60 万元,则该企业所得纯利润的估计值为 1.7 6 0.5 9.7 万元; 因为 y 关于 x 的线性回归方程为1.6 0.2 y x , 所以若 B 项目投资 60 万元,则该企业所得纯利润的估计值为 1.6 6 0.2 9.8 万元. 因为 9.8 9.7 ,所以可预测 B 项目的收益更好.
相关热词搜索: 解析 统计 专题