54用样本估计总体

用样本估计总体

一、考点梳理

1.频率分布直方图

(1)作频率分布直方图的步骤

①求极差(即一组数据中最大值与最小值的差) ;②决定组距与组数;③将数据分组; ④列频率分布表;⑤画频率分布直方图. (2)频率分布折线图和总体密度曲线

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.

②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 2.茎叶图

用茎叶图表示数据有两个突出的优点:

一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以随时记录,方便记录与表示. 3.

4. 1.易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.

频率

2.易忽视频率分布直方图中纵轴表示的应为.

组距

3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.

5、方法技巧:利用频率分布直方图求众数、中位数与平均数

利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 二、基础自测

1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm) .根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的株数大约是( )

A .3 000 B .6 000 C .7 000 D .8 000

11 12 13

4 6 2

8

2. 某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )

A .125 B .55 C .45 D .5

15 16 17

5 1 1

5 3 2

7 3

8 5

3. 如图是根据某校10位高一同学的身高(单位:cm) 画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )

A .161 B .162 C .163 D .164 4.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图) ,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________. 三、考点解读

【例1】1

长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为 ( )

4

A .32 B .0.2 C .40 D .0.25 2.(2013·辽宁) 某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )

A .45 B .50 C .55 D .60

3.(2013·湖北) 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.

(1)直方图中x 的值为________;

(2)在这些用户中,用电量落在区间[100,250)内的户数为________.

[类题通法] 在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于这一组的频率,所有小矩形的面积之和为1.

【例2】 (2013·重庆) (单位:分) .已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )

A .2,5 B .5,5 C .5,8 D .8,8

甲组 乙组

变式:在本例条件下:(1)求乙组数据的中位数、众数; 9 0 9 (2)求乙组数据的方差 x 2 1 5 y 8

7 4 2 4

[类题通法] 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其 缺点是当样本容量较大时,作图较繁琐.

【针对训练】一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( )

A .

【例3】

[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差) 分析稳定情况.

2.若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差) ;另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差) 的大小.

【针对训练】(2014·济南模拟) 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲、x 和中位数y 甲、y 乙进行比较,下面结论正确的是( )

A.x 甲>x 乙,y 甲>y 乙 B. x 甲y 乙 D. x 甲>x 乙,y 甲

四、当堂检测 1.(2013·福建) 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600

名,据此估计,该模块测试成绩不少于60分的学生人数为( )

A .588 B .480 C .450 D .120

2.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( ) A .40.6,1.1 B .48.8,4.4 C .81.2,44.4 D.78.8,75.6 3. 学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则

n 的值为_______.

4.(2014新课标全国Ⅱ) 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市

民对这两部门的评分(评分越高表明市民的评价越高) ,绘制茎叶图如下:

(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评

五、课后巩固

1.某部门计划对某路段进行限速,为调查限速60 km /h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图,则这

300辆汽车中车速低于限速的汽车有( )

A .75辆 B .120辆 C .180辆

D .270辆

2.

直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )

A .0.006 B .0.005 C .0.004 5 D .0.002 5

3.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )

A .19、13 B .13、19 C .20、18 D .18、20 4(2014陕西) 某公司10位员工的月工资(单位:元)

为x 1,x 2,„,x 10 ,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. x ,s 2+1002 B. x +100, s 2+1002 C. x ,s 2 D. x +100, s 2

5.容量为60的样本的频率分布直方图共有n (n >1)个小矩形,若其中一个小矩形的面积等于其余n -1个小

1

,则这个小矩形对应的频数是________.

5

6.某学校为准备参加市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并采用茎叶图表示本次测试30人的跳高成绩(单位:cm) ,跳高成绩在175 cm 以上(包括175 cm) 定义为“合格”,跳高成绩在175 cm以下(不包括175 cm)定义为“不合格”.

(1)如果用分层抽样的方法从甲、乙两队所有的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?

(2)若从甲队178 cm(包括178 cm) 以上的6人中抽取2人,则至少有一人在186 cm以上(包括186 cm)的概率为多少?

7.(2014新课标全国Ⅰ) 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: (1)在下表中作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均

数及方差(同一组中的数据用该组区间的中点值作代表) ; (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?

用样本估计总体

一、考点梳理

1.频率分布直方图

(1)作频率分布直方图的步骤

①求极差(即一组数据中最大值与最小值的差) ;②决定组距与组数;③将数据分组; ④列频率分布表;⑤画频率分布直方图. (2)频率分布折线图和总体密度曲线

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.

②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 2.茎叶图

用茎叶图表示数据有两个突出的优点:

一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以随时记录,方便记录与表示. 3.

4. 1.易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.

频率

2.易忽视频率分布直方图中纵轴表示的应为.

组距

3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.

5、方法技巧:利用频率分布直方图求众数、中位数与平均数

利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 二、基础自测

1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm) .根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的株数大约是( )

A .3 000 B .6 000 C .7 000 D .8 000

11 12 13

4 6 2

8

2. 某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )

A .125 B .55 C .45 D .5

15 16 17

5 1 1

5 3 2

7 3

8 5

3. 如图是根据某校10位高一同学的身高(单位:cm) 画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )

A .161 B .162 C .163 D .164 4.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图) ,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________. 三、考点解读

【例1】1

长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为 ( )

4

A .32 B .0.2 C .40 D .0.25 2.(2013·辽宁) 某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )

A .45 B .50 C .55 D .60

3.(2013·湖北) 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.

(1)直方图中x 的值为________;

(2)在这些用户中,用电量落在区间[100,250)内的户数为________.

[类题通法] 在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于这一组的频率,所有小矩形的面积之和为1.

【例2】 (2013·重庆) (单位:分) .已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )

A .2,5 B .5,5 C .5,8 D .8,8

甲组 乙组

变式:在本例条件下:(1)求乙组数据的中位数、众数; 9 0 9 (2)求乙组数据的方差 x 2 1 5 y 8

7 4 2 4

[类题通法] 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其 缺点是当样本容量较大时,作图较繁琐.

【针对训练】一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( )

A .

【例3】

[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差) 分析稳定情况.

2.若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差) ;另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差) 的大小.

【针对训练】(2014·济南模拟) 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲、x 和中位数y 甲、y 乙进行比较,下面结论正确的是( )

A.x 甲>x 乙,y 甲>y 乙 B. x 甲y 乙 D. x 甲>x 乙,y 甲

四、当堂检测 1.(2013·福建) 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600

名,据此估计,该模块测试成绩不少于60分的学生人数为( )

A .588 B .480 C .450 D .120

2.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( ) A .40.6,1.1 B .48.8,4.4 C .81.2,44.4 D.78.8,75.6 3. 学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则

n 的值为_______.

4.(2014新课标全国Ⅱ) 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市

民对这两部门的评分(评分越高表明市民的评价越高) ,绘制茎叶图如下:

(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评

五、课后巩固

1.某部门计划对某路段进行限速,为调查限速60 km /h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图,则这

300辆汽车中车速低于限速的汽车有( )

A .75辆 B .120辆 C .180辆

D .270辆

2.

直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )

A .0.006 B .0.005 C .0.004 5 D .0.002 5

3.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )

A .19、13 B .13、19 C .20、18 D .18、20 4(2014陕西) 某公司10位员工的月工资(单位:元)

为x 1,x 2,„,x 10 ,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. x ,s 2+1002 B. x +100, s 2+1002 C. x ,s 2 D. x +100, s 2

5.容量为60的样本的频率分布直方图共有n (n >1)个小矩形,若其中一个小矩形的面积等于其余n -1个小

1

,则这个小矩形对应的频数是________.

5

6.某学校为准备参加市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并采用茎叶图表示本次测试30人的跳高成绩(单位:cm) ,跳高成绩在175 cm 以上(包括175 cm) 定义为“合格”,跳高成绩在175 cm以下(不包括175 cm)定义为“不合格”.

(1)如果用分层抽样的方法从甲、乙两队所有的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?

(2)若从甲队178 cm(包括178 cm) 以上的6人中抽取2人,则至少有一人在186 cm以上(包括186 cm)的概率为多少?

7.(2014新课标全国Ⅰ) 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: (1)在下表中作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均

数及方差(同一组中的数据用该组区间的中点值作代表) ; (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?


    相关文章

    第5章 抽样与参数统计.

    第五章 抽样与参数估计 学习内容 一.抽样推断概述 二.抽样分布及其应用 三.常见的抽样分布 四.参数估计 五.区间估计的计算 学习目标 1. 了解抽样和抽样分布的基本概念. 2. 理解抽样分布与总体分布的关系. 3. 了解点估计的概念和估 ...

    统计和数据

    第一章 统计和数据 复习要点 一.基本含义 1.统计就是用来处理数据的,它是关于数据的一门学问. 2.统计学是用以收集数据,分析数据和由数据得出结论的一组概念.原则和方法.统计分析数据的方法大体上可分为描述统计和推断统计两大类. 描述统计是 ...

    参数估计习题

    第5章 参数估计练习题 一.选择题 1. 估计量的含义是指( ) A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C .总体参数的名称 D .总体参数的具体取值 2.一个95%的置信区间是指( ) A. 总体 ...

    数理统计学习感想

    数理统计学习感想 现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征.例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比 ...

    统计相关知识_第三章第三节样本量的确定_2013年版

    1.设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在重置抽样时,共有( )个样本 A:25 B:10 C:5 D:1 答案:A 解析:在重置抽样时,共有Nn 种抽法,共有样本Nn个,即52=5×5=25个. 2.设一个总体共有5个 ...

    第四章 审计抽样-传统变量抽样

    2015年注册会计师资格考试内部资料 审计 第四章 审计抽样 知识点:传统变量抽样 ● 详细描述: 1.估计总体错报方法 (1)均值估计抽样 ①计算样本平均价值(每一笔业务的平均金额) ②估计总体金额 估计的总体金额=样本平均金额×总体规模 ...

    简单随机抽样(答案)

    简单随机抽样 一.单选题 1. 抽样比的计算公式为( B ). A. f= (n-1)/ (N-1) B. f=n/N C. f= (n-1)/N D. f= (N-n)/N 2. 不放回的简单随机抽样指的是哪种情形的随机抽样?(D ) A ...

    用样本估计总体及线性相关关系

    用样本估计总体及线性相关关系 一.[课标要求] 1.用样本估计总体 ①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表.画频率分布直方图.频率折线图.茎叶图,体会他们各自的特点: ②通过实例理解样本数据标准差的意义和作 ...

    清华大学概率论与数理统计笔记

    抽样理论 总体:研究对象的全体 样本:从总体中随机抽取的数据.样本用大写字母表示.样本的观测值用小写字母表示.抽取的样本个数称为样本容量 简单随机抽样: 随机性:样本分布和总体分布相同 独立性:各个样本X1, -,Xn是相互独立的 总体参数 ...

    社会统计学 复习资料

    1.参数:是一个变量.我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示.如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做 ...