随机抽样
【教学目标】
1.理解全面调查、抽样调查、总体、个体、样本、样本量、样本数据等概
念
2.理解简单随机抽样的概念,掌握简单随机抽样的两种方法:抽签法和随
机数法
3.理解分层随机抽样的概念,并会解决相关问题
【教学重难点】
1.抽样调查
2.简单随机抽样
3.分层随机抽样
【教学过程】
一、问题导入
预习教材内容,思考以下问题:
1.全面调查、抽样调查、总体、个体、样本、样本量、样本数据的概念是
什么?
2.什么叫简单随机抽样?
3.最常用的简单随机抽样方法有哪两种?
4.抽签法是如何操作的?
5.随机数法是如何操作的?
6.什么叫分层随机抽样?
7.分层随机抽样适用于什么情况?
8.分层随机抽样时,每个个体被抽到的机会是相等的吗?
9.获取数据的途径有哪些?
二、基础知识
1.全面调查与抽样调查
(1)对每一个调查对象都进行调查的方法,称为全面调查,又称普查W.
(2)在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个
调查对象称为个体W.
(3)根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据
1/23
对总体的情况作出估计和推断的调查方法,称为抽样调查W.
(4)把从总体中抽取的那部分个体称为样本W.
(5)样本中包含的个体数称为样本量W.
(6)调查样本获得的变量值称为样本的观测数据,简称样本数据.
2.简单随机抽样
(1)有放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n
个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的
概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
(2)不放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的
概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
(3)简单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.
(4)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(5)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
名师点拨
(1)从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随
机抽取n个个体作为样本,两种方法是等价的.
(2)简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公
平性.
3.总体平均数与样本平均数
(1)总体平均数
①一般地,总体中有N个个体,它们的变量值分别为Y
1
,Y
2
,…,Y
N
,则
-
Y
1
+Y
2
+…+Y
N1N
称Y==
Ni
∑
Y
i
为总体均值,又称总体平均数.
=1N
②如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y
1
,Y
2
,…,
Y
k
,其中Y
i
出现的频数f
i
(i=1,2,…,k),则总体均值还可以写成加权平均数
-
1k
的形式Y=
Ni
∑
f
i
Y
i
W.
=1
2/23
(2)样本平均数
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y
1
,y
2
,…,
y
1
+y
2
+…+y
n1n-
y
n
,则称y==
ni
∑
y
i
为样本均值,又称样本平均数.在简单随机
=1n
-
-
抽样中,我们常用样本平均数y去估计总体平均数Y.
4.分层随机抽样
(1)分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅
属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中
抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子
总体称为层W.
(2)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本
量的分配方式为比例分配.
5.分层随机抽样中的总体平均数与样本平均数
(1)在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体
数分别为M和N,抽取的样本量分别为m和n.我们用X
1
,X
2
,…,X
M
表示第
1层各个个体的变量值,用x
1
,x
2
,…,x
m
表示第1层样本的各个个体的变量值;
用Y
1
,Y
2
,…,Y
N
表示第2层各个个体的变量值,用y
1
,y
2
,…,y
n
表示第2层
-
样本的各个个体的变量值,则:①第1层的总体平均数和样本平均数分别为X=
X
1
+X
2
+…+X
M1Mx
1
+x
2
+…+x
m1m-
=
Mi
∑
X
i
,x==
mi
∑
x
i
.
=1=1Mm
-
Y
1
+Y
2
+…+Y
N1N-
②第2层的总体平均数和样本平均数分别为Y==∑
Y,y
iNNi=1
y
1
+y
2
+…+y
n1n
==
ni
∑
y
i
.
=1n
∑
X+∑Y
∑
x+∑y
-i=1
i
i=1
i-i=1
i
i=1
i
③总体平均数和样本平均数分别为W=,w=W.
M+Nm+n
-
(2)由于用第1层的样本平均数
-
x可以估计第1层的总体平均数X,用第
-
-
2层的样本平均数y可以估计第2层的总体平均数Y.因此我们可以用
--
M×x+N×yM
-
N
-
=x+y估计总体平均数
-
W.
M+NM+NM+N
mn
m+n
M
-
N
-
(3)在比例分配的分层随机抽样中,==,可得x+y
MN
M+NM+NM+N
3/23
MNmn
m
-
n
--
x+y=w.因此,在比例分配的分层随机抽样中,我们可以直接
m+nm+n
用样本平均数
-
w估计总体平均数
-
W.
=
6.获取数据的途径
获取数据的基本途径有:(1)通过调查获取数据;(2)通过试验获取数据;
(3)通过观察获取数据;(4)通过查询获取数据
三、合作探究
总体、样本等概念辨析题
例1:为了调查参加运动会的1000名运动员的平均年龄,从中抽取了100
名运动员进行调查,下面说法正确的是()
A.1000名运动员是总体
B.每个运动员是个体
C.抽取的100名运动员是样本
D.样本量是100
【解析】根据调查的目的可知,总体是这1000名运动员的年龄,个体是每
个运动员的年龄,样本是抽取的100名运动员的年龄,样本量为100.故答案为
D.
【答案】D
[规律方法]
此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本
与样本容量的不同,其中样本量为数目,无单位.
简单随机抽样的概念
例2:下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次抽取100支火炬进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展
救灾工作.
【解】(1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的
个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响
个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机
4/23
抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可
能性不同,不符合简单随机抽样中“等可能抽样”的要求.
[规律方法]
要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随
机抽样的定义,即简单随机抽样的四个特点.
抽签法及随机数法的应用
例3:某班有50名学生,要从中随机地抽出6人参加一项活动,请分别写
出利用抽签法和随机数法抽取该样本的过程.
【解】(1)利用抽签法步骤如下:
第一步:将这50名学生编号,编号为01,02,03,…,50.
第二步:将50个号码分别写在纸条上,并揉成团,制成号签.
第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.
第四步:从容器中逐一抽取6个号签,并记录上面的号码.
对应上面6个号码的学生就是参加该项活动的学生.
(2)利用随机数法步骤如下:
第一步:将这50名学生编号,编号为1,2,3,…,50.
第二步:用随机数工具产生1~50范围内的整数随机数,把产生的随机数作
为抽中的编号,使与编号对应的学生进入样本.
第三步:重复第二步的过程,直到抽足样本所需人数.
对应上面6个号码的学生就是参加该项活动的学生.
[规律方法]
(1)利用抽签法抽取样本时应注意以下问题:
①编号时,如果已有编号(如学号、标号等)可不必重新编号.(例如该题
中50名同学,可以直接利用学号)
②号签要求大小、形状完全相同.
③号签要搅拌均匀.
④抽取号签时要逐一、不放回抽取.
(2)利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,
即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同
编号个数等于样本所需的人数.
5/23
分层随机抽样中的有关计算
例4:(1)某单位共有老、中、青年职工430人,其中有青年职工160人,
中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层随机抽
样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工的
人数为W.
(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设
了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共
有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
泥塑
剪纸
高一年级高二年级高三年级
a
x
b
y
c
z
3
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的
5
,为了
了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则
从高二年级“剪纸”社团的学生中应抽取人.
【解析】(1)设该单位老年职工人数为x,由题意得3x=430-160,解得x
32
=90.则样本中的老年职工人数为90×
160
=18.
3
(2)法一:因为“泥塑”社团的人数占总人数的
5
,
2
故“剪纸”社团的人数占总人数的
5
,
2
所以“剪纸”社团的人数为800×
5
=320;
y33
因为“剪纸”社团中高二年级人数比例为==
10
,
x+y+z2+3+5
3
所以“剪纸”社团中高二年级人数为320×
10
=96.
501
由题意知,抽样比为
800
=
16
,
1
所以从高二年级“剪纸”社团中抽取的人数为96×
16
=6.
3
法二:因为“泥塑”社团的人数占总人数的
5
,
2
故“剪纸”社团的人数占总人数的
5
,
2
所以抽取的50人的样本中,“剪纸”社团中的人数为50×
5
=20.
6/23
y33
==
10
,
x+y+z2+3+5
3
所以从高二年级“剪纸”社团中抽取的人数为20×
10
=6.
又“剪纸”社团中高二年级人数比例为
【答案】(1)18(2)6
[规律方法]
分层随机抽样中有关计算的方法
该层样本量n该层抽取的个体数
(1)抽样比==.
总样本量N该层的个体数
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上
面两个等量关系求解.
样本平均数的求法
例5:(1)甲在本次飞镖游戏中的成绩为8,6,7,7,8,10,9,8,7,8.求
甲在本次游戏中的平均成绩.
(2)在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了
一个容量为10的样本,并算得样本的平均数为5;乙同学抽取了一个容量为8
的样本,并算得样本的平均数为6.已知甲、乙两同学抽取的样本合在一起组成
一个容量为18的样本,求合在一起后的样本均值.
6+3×7+4×8+9+10
【解】(1)甲在本次游戏中的平均成绩为=7.8.
10
10×5+8×650+48
49
(2)合在一起后的样本均值为=
18
=
9
.
10+8
[规律方法]
在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本
mx+ny
量为n,平均值为y,则样本的平均值为.
m+n
【课堂检测】
1.在简单随机抽样中,每一个个体被抽中的可能性()
A.与第几次抽样有关,第一次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性要大些
D.每个个体被抽中的可能性无法确定
解析:选B.在简单随机抽样中,每一个个体被抽中的可能性都相等,与第
7/23
几次抽样无关.
2.若对某校1200名学生的耐力做调查,抽取其中120名学生,测试他们
1500米跑的成绩,得出相应的数值,在这项调查中,样本是指()
A.120名学生
B.1200名学生
C.120名学生的成绩
D.1200名学生的成绩
解析:选C.本题抽取的是120名学生的成绩,因此每个学生的成绩是个体,
这120名学生的成绩构成一个样本.
3.(2019·广西钦州市期末考试)某中学共有1000名学生,其中高一年级
350人,该校为了了解本校学生视力情况,用分层随机抽样的方法从该校学生中
抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为()
A.20
C.30
B.25
D.35
350
解析:选D.高一年级抽取的人数为
1000
×100=35.故选D.
4.在调查某中学的学生身高时,利用分层抽样的方法抽取男生20人,女生
15人,得到了男生身高的平均值为170,女生身高的平均值为165.试估计该中
学所有学生的平均身高是多少?
20×170+15×165
587566
解:=
35
=167
7
.即该中学所有学生的平均身高为167
7
.
20+15
第四步,把与号码相对应的人抽出,即可得到所要的样本.
统计案例公司员工的肥胖情况调查分析
【教学重难点】
数据分析。
【教学目标】
针对实际统计案例进
行调查分析。
【核心素养】
数学应用。
【教学过程】
一、背景导入
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.
目前,国际上常用身体质量指数(BodyMassIndex,缩写BMT)来衡量人体胖
8/23
瘦程度以及是否健康,其计算公式是
中国成人的BMI数值标准为:BMI<18.5为偏瘦;18.5≤BMI<23.9为正常;
24≤BMI<27.9为偏胖;BMI≥28为肥胖。
二、数据调查
为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用
比例分配的分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数
据,计算得到他们的BMI值如下:
三、合作探究
根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:
1.选择合适的图表展示数据;
2.比较男、女员工在肥胖状况上的差异;
3.分析公司员工胖瘦程度的整体情况;
4.提出控制体重的建议.
四、教师指导
统计分析报告的主要组成部分
1.标题
2.前言
9/23
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况。
3.主体
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的
信息;根据数据分析的需要,说明如何选择合适的图表描述和表达数据;从样本
数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状
况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体情况.
4.结尾
对主体部分的内容进行概括,结合控制体重的一般方法(可以查阅有关文
献),提出控制公司员工体重的建议.
用样本估计总体
【第一课时】
【教学目标】
1.会画一组数据的频率分布表、频率分布直方图.
2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体
进行估计.
3.掌握求n个数据的第p百分位数的方法.
【教学重难点】
1.频率分布表、频率分布直方图.
2.用样本估计总体.
3.总体百分位数的估计.
【教学过程】
一、问题导入
预习教材内容,思考以下问题:
1.绘制频率分布表和频率分布直方图有哪些步骤?
2.频率分布直方图有哪些特征?
3.如何求n个数据的第p百分位数?
二、基础知识
10/23
1.频率分布表、频率分布直方图的制作步骤及意义
2.百分位数
(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组
数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等
于这个值.
(2)计算步骤:计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项
数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
三、合作探究
1.频率分布表、频率分布直方图、频率分布折线图的绘制
角度一:频率分布表、频率分布直方图的绘制
为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:
kg)如下:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,
46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,
55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
【解】以4为组距,列表如下:
分组频率累计
11/23
频数频率
[41.5,45.5)
[45.5,49.5)
[49.5,53.5)
[53.5,57.5)
[57.5,61.5)
[61.5,65.5)
[65.5,69.5)
2
7
8
16
5
4
2
0.0455
0.1591
0.1818
0.3636
0.1136
0.0909
0.0455
频率分布直方图和频率分布折线图如图所示.
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若
极差极差
为整数,则=组数;
组距组距
极差极差
②若不为整数,则的整数部分+1=组数.
组距组距
(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,
纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解
数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一
般样本量越大,所分组数越多.
角度二:频率分布直方图的应用
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数
测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小
长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
12/23
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标
率是多少?
(3)样本中不达标的学生人数是多少?
(4)第三组的频数是多少?
【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,
4
因此第二小组的频率为=0.08.
2+4+17+15+9+3
又因为第二小组的频率=
第二小组的频数
,
样本量
所以样本容量=
第二小组的频数12
==150.
第二小组的频率0.08
17+15+9+3
(2)由直方图可估计该校高一年级学生的达标率为×
2+4+17+15+9+3
100%=88%.
(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1
-0.88=0.12.
所以样本中不达标的学生人数为150×0.12=18(人).
17
(4)第三小组的频率为=0.34.
2+4+17+15+9+3
又因为样本量为150,
所以第三组的频数为150×0.34=51.
频率分布直方图的应用中的计算问题
频率
(1)小长方形的面积=组距×=频率;
组距
(2)各小长方形的面积之和等于1;
13/23
频数频数
(3)=频率,此关系式的变形为=样本量,样本量×频率=频数.
样本量频率
2.条形统计图
为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部
分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内
容),整理调查结果,绘制统计图如图所示.
请根据统计图提供的信息回答以下问题:
(1)求抽取的学生数;
(2)若该校有3000名学生,估计喜欢收听易中天《品三国》的学生人数;
(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人
数的百分比.
【解】(1)从统计图上可以看出,
喜欢收听于丹析《庄子》的男生有20人,女生有10人;
喜欢收听《故宫博物院》的男生有30人,女生有15人;
喜欢收听于丹析《论语》的男生有30人,女生有38人;
喜欢收听易中天《品三国》的男生有64人,女生有42人;
喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.
所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).
(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106
106
人,占所抽取总人数的比例为
300
,
由于该校有3000名学生,因此可以估计喜欢收听易中天《品三国》的学生
106
有
300
×3000=1060(人).
(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的
45
比例为
300
×100%=15%.
14/23
(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,
第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.
实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画
(描述)就越精确.
(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数
据为准,它直观反映了各部分在总体中所占比重的大小.
3.折线统计图
小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线
图.
根据图中的信息,回答以下问题:
(1)护士每隔几小时给小明测量一次体温?
(2)近三天来,小明的最高体温、最低体温分别是多少?
(3)从体温看,小明的病情是在恶化还是在好转?
(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那
么小明最快什么出院?
【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.
(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是
39.5摄氏度,最低体温是36.8摄氏度.
(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.
(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏
度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因
此小明最快可以在9月10凌晨6时出院.
(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意
义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第
三步,用直线段顺次连接即可.
15/23
(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情
况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
4.扇形统计图
下图是A,B两所学校艺术节期间收到的各类艺术作品的情况的统计图:
(1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?
(2)已知A学校收到的剪纸作品比B学校的多20件,收到的书法作品比B
学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?
【解】(1)不能.因为两所学校收到艺术作品的总数不知道.
(2)设A学校收到艺术作品的总数为x件,B学校收到艺术作品的总数为
10%x-5%y=20,
x=500,
y件,则
解得即A学校收到艺术作品的总数为500
50%y-40%x=100,
y=600,
件,B学校收到艺术作品的总数为600件.
(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的
度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.
(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇
形统计图,其不同的百分比不可以作为比较的依据.
5.百分位数的计算
现有甲、乙两组数据如下表所示.
序号
甲组
乙组
1
1
0
2
2
0
3
2
0
4
2
0
5
2
1
6
3
1
7
3
2
8
3
3
9
5
4
10
5
5
11
6
6
12
6
6
13
8
7
14
8
7
15
9
10
16
10
14
17
10
14
18
12
14
19
13
14
20
13
15
试求甲、乙两组数的25%分位数与75%分位数.
【解】因为数据个数为20,而且20×25%=5,20×75%=15.
x
5
+x
6
2+3
因此,甲组数的25%分位数为
2
=
2
=2.5;
16/23
x
15
+x
16
9+10
甲组数的75%分位数为
2
=
2
=9.5.
x
5
+x
6
1+1x
15
+x
16
乙组数的25%分位数为
2
=
2
=1,乙组的75%分位数为
2
=
10+14
2
=12.
求百分位数时,一定要将数据按照从小到大的顺序排列.
【课堂检测】
1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是
()
解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比
较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中
的图不能称为统计图.
2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2700,
3000)g的频率为()
A.0.1
C.0.3
B.0.2
D.0.4
解析:选C.由题图可得,新生儿体重在[2700,3000)g的频率为0.001×300
=0.3,故选C.
17/23
3.观察下图所示的统计图,下列结论正确的是()
A.甲校女生比乙校女生多
B.乙校男生比甲校男生少
C.乙校女生比甲校男生少
D.甲、乙两校女生人数无法比较
解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因
此男生与女生的具体人数也无法得知.
【第二课时】
【教学目标】
1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的
18/23
众数、中位数、平均数.
2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准
差.
【教学重难点】
会用样本的基本数字特征来估计总体的基本数字特征.
【教学过程】
一、基础知识
1.众数、中位数、平均数
众数、中位数、平均数定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间
位置的数(或中间两个数的平均数)叫做这组数据的中位数.
1
(3)平均数:如果n个数x
1
,x
2
,…,x
n
,那么x=
n
(x
1
+x
2
+…+x
n
)叫做
这n个数的平均数.
思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有
何缺点?
答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数
据总体的信息,但是平均数受数据中极端值的影响较大.
2.方差、标准差
标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.
1
s=
n
[(x
1
-x)2+(x
2
-x)2+…+(x
n
-x)2].
(2)标准差的平方s2叫做方差.
1
s2=
n
[(x
1
-x)2+(x
2
-x)2+…+(x
n
-x)2](x
n
是样本数据,n是样本容量,x
是样本平均数).
(3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样
本数据均为x.
二、合作探究
19/23
1.众数、中位数、平均数的计算
(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1
人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组
数学成绩的平均数、众数、中位数分别为()
A.85,85,85
C.87,85,85
B.87,85,86
D.87,85,90
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成
绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别
为()
A.2,5
C.5,8
B.5,5
D.8,8
答案(1)C(2)C
100+95+90×2+85×4+80+75
解析(1)平均数为=87,众数为85,中
10
位数为85.
(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行
求解.
由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为
9+15+10+y+18+24
=16.8,所以y=8,所以x,y的值分别为5,8.
5
【教师小结】平均数、众数、中位数的计算方法:
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按
从小到大或从大到小的顺序排列,再根据各自的定义计算.
2.标准差、方差的计算及应用
甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
20/23
(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参
加射击比赛,选谁去合适?
1
解(1)x
甲
=
10
×(8+6+7+8+6+5+9+10+4+7)=7(环),
1
x乙
=
10
×(6+7+7+8+6+7+8+7+9+5)=7(环).
1
2(2)由方差公式s2=
n
[(x
1
-x)2+(x
2
-x)2+…+(x
n
-x)2],得s2
甲
=3,s
乙
=1.2.
(3)x
甲
=x
乙
,说明甲、乙两战士的平均水平相当.
2又s2
甲
>s
乙
说明甲战士射击情况波动比乙大.
因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加
比赛.
【教师小结】
(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较
两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越
小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本
数据在样本平均数的两边越分散.
(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估
计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.
三、课堂总结
1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散
程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知
的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样
本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有
随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答
案.
【课堂检测】
1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
21/23
则这组数据的中位数是()
A.19
C.21.5
答案B
解析由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有
5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.
故选B.
2.下列关于平均数、中位数、众数的说法中正确的一个是()
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
答案D
3.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若
B样本数据恰好是A样本数据每个都加2后所得的数据,则A,B两样本的下列
数字特征对应相同的是()
A.众数
C.中位数
答案D
4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选
手的作品打出的分数的茎叶图如图所示(其中m为数字0~9中的一个),去掉一
个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a
1
,a
2
,则一定
有()
B.平均数
D.标准差
B.20
D.23
A.a
1
>a
2
B.a
2
>a
1
C.a
1
=a
2
22/23
D.a
1
,a
2
的大小与m的值有关
答案B
解析由茎叶图知,
1+5+5+4+5
a
1
=80+=84,
5
4+4+6+4+7
a
2
=80+=85,故选B.
5
5.若样本数据x
1
,x
2
,…,x
10
的标准差为8,则数据2x
1
-1,2x
2
-1,…,
2x
10
-1的标准差为________.
答案16
解析设样本数据x
1
,x
2
,…,x
10
的标准差为s,则s=8,
可知数据2x
1
-1,2x
2
-1,…,2x
10
-1的标准差为2s=16.
23/23
本文发布于:2022-10-30 08:24:17,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/82/412180.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |