1、研究对象的变化程度
通常,总体方差越大,意味着总体内部各事物在调查表现上的差异程度越大,所以需要的样本容量越大,应该多抽一些样本单位。也就是说,研究的现象越复杂、差异越大,样本量要求就越大。
2、研究允许的误差大小(精确度)
一般来说,允许误差越大,意味着对抽样的估计精度要求不高,所以就可以少抽取一些样本单位,需要的样本容量较小。反之,如果允许误差很小,就是研究要求精确度较高,那么需要的样本量就会比较大。所以,精度要求越高,样本量越大。
3、要求推断的置信程度
在经验上,我们会选择0.05、0.01、0.001这三个水平作为可以接受的犯错概率。所以,0.05是统计上可以接受的最低标准,也是需要样本最少的情况,把犯错概率控制在0.001以下,是非常严格的标准,需要的样本量也越大。
同时,这三个犯错概率分别对应的可靠性系数为0.95、0.99、0.999。也就是说,可靠性系数越大,需要的样本容量越大。
4、抽样类型和方法
样本抽取的方法分为随机抽样和非随机抽样。
扩展资料
样本容量的相关性质:
研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值。
如果设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大。
多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。
参考资料来源:百度百科-样本容量
样本是从总体中抽出的部分单位集合,这个集合的大小叫做样本量。
一般而言,样本的容量大的话,样本的误差就小,反之则大。
通常样本单位数大于30的样本可以称为大样本,小于30的样本则称为小样本。在实际应用中,我们应该根据调查的目的认真考虑样本量的大小。
样本容量的大小涉及调研中包括的单元数。从定性的方面考虑样本量,因素有:决策的重要性,调研的性质,变数个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。决策越重要,需要更多和更准确的信息,就需要用较大的样本;探索性研究,样本量一般较小,结论性研究则需要较大的样本;收集有关许多变数的数据,样本量就要大一些,减少抽样误差的积累效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析时,需要的样本量比对总样本分析要大许多。
样本量的确定有相应的统计学公式,具体取决于
1. 研究对象的变化程度
2. 精确度要求(即允许误差的大小)
3. 推断的置信程度
公式:
已知总体方差,重复抽样时,至少应抽取的样本量为n。(给定极限误差和概率误差)
已知总体方差,不重复抽样时,至少应抽取的样本量为n。
其中,Z为概率度,N为样本总数,α为极限误差。