9.1随机抽样与用样本估计总体
课程标准有的放矢
1.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.
2.了解总体、样本、样本量的概念,了解数据的随机性.
3.通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法.会计算样本均值和样本方差,了解样本与总体的关系.
4.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.结合具体实例,掌握分层随机抽样的样本均值和样本方差.
5.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.
6.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
7.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
8.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
9.结合实例,能用样本估计总体的取值规律.
10.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
必备知识温故知新
【教材梳理】
1.简单随机抽样
(1)特点:逐个抽取,且每个个体被抽取的概率相等.
(2)常用方法:抽签法和随机数法.
(3)适用范围:个体性质相似,无明显层次,且个体数量较少,尤其是样本容量较少.
2.分层随机抽样
(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)适用范围:总体可以分层,且层与层之间有明显区别,而层内个体差异较小.
(3)平均数的计算:各层抽样比乘各层平均数的和.
3.用样本估计总体
(1)总体取值规律的估计.
①画频率分布直方图的五个步骤:求极差、决定组距与组数、将数据分组、列频率分布表、画频率分布直方图.
②频率分布直方图的特点:各个小长方形的面积表示相应各组的频率;各小长方形的面积的总和等于1.
(2)总体百分位数的估计.
①第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有100?
②计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据;第2步,计算i=n×p%;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i
③四分位数:常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
(3)总体集中趋势的估计.
众数:一组数据中重复出现次数最多的数据.
中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置(或中间两个数的平均值)的数叫做这组数据的中位数.
平均数:如果n个数x1,x2,?,xn,那么x=
一般地,对数值型数据集中趋势的描述,可以用平均数、中位数;而对分类型数据集中趋势的描述,可以用众数.
(4)总体离散程度的估计.
①方差、标准差的定义:一组数据x1,x2,?,xn,用x表示这组数据的平均数,则这组数据的方差为1n∑ni=1
②方差、标准差的特点:标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
常用结论
1.频率分布直方图中,最高的小长方形底边中点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
2.若数据x1,x2,?,xn的平均数为x,方差为s2,则数据mx1+a,mx
自主评价牛刀小试
1.判断下列命题是否正确,正确的在括号内画“√”,错误的画“×”.
(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关. (×)
(2)在分层随机抽样中,每个个体被抽到的可能性与层数及分层有关. (×)
(3)若样本量n=100,则第50百分位数是从小到大排列的第50个数. (
(4)一组数据的众数可以是一个或几个,中位数也具有相同的结论. (×)