用样本估计总体
一、考点梳理
1.频率分布直方图
(1)作频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差) ;②决定组距与组数;③将数据分组; ④列频率分布表;⑤画频率分布直方图. (2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 2.茎叶图
用茎叶图表示数据有两个突出的优点:
一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以随时记录,方便记录与表示. 3.
4. 1.易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.
频率
2.易忽视频率分布直方图中纵轴表示的应为.
组距
3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.
5、方法技巧:利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 二、基础自测
1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm) .根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的株数大约是( )
A .3 000 B .6 000 C .7 000 D .8 000
11 12 13
4 6 2
8
2. 某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )
A .125 B .55 C .45 D .5
15 16 17
5 1 1
5 3 2
7 3
8 5
3. 如图是根据某校10位高一同学的身高(单位:cm) 画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )
A .161 B .162 C .163 D .164 4.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图) ,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________. 三、考点解读
【例1】1
长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为 ( )
4
A .32 B .0.2 C .40 D .0.25 2.(2013·辽宁) 某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A .45 B .50 C .55 D .60
3.(2013·湖北) 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)直方图中x 的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
[类题通法] 在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于这一组的频率,所有小矩形的面积之和为1.
【例2】 (2013·重庆) (单位:分) .已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )
A .2,5 B .5,5 C .5,8 D .8,8
甲组 乙组
变式:在本例条件下:(1)求乙组数据的中位数、众数; 9 0 9 (2)求乙组数据的方差 x 2 1 5 y 8
7 4 2 4
[类题通法] 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其 缺点是当样本容量较大时,作图较繁琐.
【针对训练】一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( )
A .
【例3】
[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差) 分析稳定情况.
2.若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差) ;另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差) 的大小.
【针对训练】(2014·济南模拟) 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲、x 和中位数y 甲、y 乙进行比较,下面结论正确的是( )
A.x 甲>x 乙,y 甲>y 乙 B. x 甲y 乙 D. x 甲>x 乙,y 甲
乙
四、当堂检测 1.(2013·福建) 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600
名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A .588 B .480 C .450 D .120
2.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( ) A .40.6,1.1 B .48.8,4.4 C .81.2,44.4 D.78.8,75.6 3. 学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则
n 的值为_______.
4.(2014新课标全国Ⅱ) 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市
民对这两部门的评分(评分越高表明市民的评价越高) ,绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评
五、课后巩固
1.某部门计划对某路段进行限速,为调查限速60 km /h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图,则这
300辆汽车中车速低于限速的汽车有( )
A .75辆 B .120辆 C .180辆
D .270辆
2.
直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )
A .0.006 B .0.005 C .0.004 5 D .0.002 5
3.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )
A .19、13 B .13、19 C .20、18 D .18、20 4(2014陕西) 某公司10位员工的月工资(单位:元)
为x 1,x 2,„,x 10 ,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. x ,s 2+1002 B. x +100, s 2+1002 C. x ,s 2 D. x +100, s 2
5.容量为60的样本的频率分布直方图共有n (n >1)个小矩形,若其中一个小矩形的面积等于其余n -1个小
1
,则这个小矩形对应的频数是________.
5
6.某学校为准备参加市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并采用茎叶图表示本次测试30人的跳高成绩(单位:cm) ,跳高成绩在175 cm 以上(包括175 cm) 定义为“合格”,跳高成绩在175 cm以下(不包括175 cm)定义为“不合格”.
(1)如果用分层抽样的方法从甲、乙两队所有的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?
(2)若从甲队178 cm(包括178 cm) 以上的6人中抽取2人,则至少有一人在186 cm以上(包括186 cm)的概率为多少?
7.(2014新课标全国Ⅰ) 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: (1)在下表中作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均
数及方差(同一组中的数据用该组区间的中点值作代表) ; (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
用样本估计总体
一、考点梳理
1.频率分布直方图
(1)作频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差) ;②决定组距与组数;③将数据分组; ④列频率分布表;⑤画频率分布直方图. (2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 2.茎叶图
用茎叶图表示数据有两个突出的优点:
一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以随时记录,方便记录与表示. 3.
4. 1.易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.
频率
2.易忽视频率分布直方图中纵轴表示的应为.
组距
3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.
5、方法技巧:利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 二、基础自测
1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm) .根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的株数大约是( )
A .3 000 B .6 000 C .7 000 D .8 000
11 12 13
4 6 2
8
2. 某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )
A .125 B .55 C .45 D .5
15 16 17
5 1 1
5 3 2
7 3
8 5
3. 如图是根据某校10位高一同学的身高(单位:cm) 画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )
A .161 B .162 C .163 D .164 4.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图) ,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________. 三、考点解读
【例1】1
长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为 ( )
4
A .32 B .0.2 C .40 D .0.25 2.(2013·辽宁) 某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A .45 B .50 C .55 D .60
3.(2013·湖北) 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)直方图中x 的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
[类题通法] 在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于这一组的频率,所有小矩形的面积之和为1.
【例2】 (2013·重庆) (单位:分) .已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )
A .2,5 B .5,5 C .5,8 D .8,8
甲组 乙组
变式:在本例条件下:(1)求乙组数据的中位数、众数; 9 0 9 (2)求乙组数据的方差 x 2 1 5 y 8
7 4 2 4
[类题通法] 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其 缺点是当样本容量较大时,作图较繁琐.
【针对训练】一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( )
A .
【例3】
[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差) 分析稳定情况.
2.若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差) ;另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差) 的大小.
【针对训练】(2014·济南模拟) 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲、x 和中位数y 甲、y 乙进行比较,下面结论正确的是( )
A.x 甲>x 乙,y 甲>y 乙 B. x 甲y 乙 D. x 甲>x 乙,y 甲
乙
四、当堂检测 1.(2013·福建) 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600
名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A .588 B .480 C .450 D .120
2.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( ) A .40.6,1.1 B .48.8,4.4 C .81.2,44.4 D.78.8,75.6 3. 学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则
n 的值为_______.
4.(2014新课标全国Ⅱ) 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市
民对这两部门的评分(评分越高表明市民的评价越高) ,绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评
五、课后巩固
1.某部门计划对某路段进行限速,为调查限速60 km /h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图,则这
300辆汽车中车速低于限速的汽车有( )
A .75辆 B .120辆 C .180辆
D .270辆
2.
直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )
A .0.006 B .0.005 C .0.004 5 D .0.002 5
3.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )
A .19、13 B .13、19 C .20、18 D .18、20 4(2014陕西) 某公司10位员工的月工资(单位:元)
为x 1,x 2,„,x 10 ,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. x ,s 2+1002 B. x +100, s 2+1002 C. x ,s 2 D. x +100, s 2
5.容量为60的样本的频率分布直方图共有n (n >1)个小矩形,若其中一个小矩形的面积等于其余n -1个小
1
,则这个小矩形对应的频数是________.
5
6.某学校为准备参加市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并采用茎叶图表示本次测试30人的跳高成绩(单位:cm) ,跳高成绩在175 cm 以上(包括175 cm) 定义为“合格”,跳高成绩在175 cm以下(不包括175 cm)定义为“不合格”.
(1)如果用分层抽样的方法从甲、乙两队所有的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?
(2)若从甲队178 cm(包括178 cm) 以上的6人中抽取2人,则至少有一人在186 cm以上(包括186 cm)的概率为多少?
7.(2014新课标全国Ⅰ) 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: (1)在下表中作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均
数及方差(同一组中的数据用该组区间的中点值作代表) ; (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?