覆盖性误差、测量性误差、 应答性误差,尽管概念都是从抽样问卷调查中产生的,
实际上,在其他类型的调查中也存在,只是呢,在不同类型的调查中,
误差的可计算性存在差别。在抽样调查中,这三类误差都是可计算的。
这一节要讨论的抽样性误差则是在抽样调查中才会出现的误差。
在讨论抽样调查的时候,我们已经讨论过 在抽样调查中抽样性误差的来源,大家还记得吗?
主要来自于制作抽样框时候形成的误差,比如对样本的覆盖性。
换句话说,在抽样调查中,覆盖性误差其实是抽样性误差的一部分。
还有在抽样过程中形成的误差,比如分层、多阶段,尤其是在
末端抽样中,采用的方法、抽样的人都有可能形成误差。
现在讨论抽样性误差,我们把注意力主要放在抽样人员身上,尤其是末端抽样。
在非抽样问卷调查中, 实际上,没有严格意义上的抽样性误差,可是如果把
选择调查对象也看作是抽取样本,那么,的确 在选择调查对象的过程中存在着造成误差的可能。
比如在文献调查中,因为使用二手文献、因为选择版本等所带来的误差; 在观察调查中,因为选择场景所带来的误差。
再比如,在访谈调查中,因为访谈对象变动所带来的误差。这些问题
在非抽样问卷调查中,同学们需要保持一种意识就可以了,那就是尽量周全的反映调查对象,
无论是访谈调查、观察调查,还是文献调查。
回到真正的抽样性误差上来, 在抽样调查中,我们没有讨论抽样误差的计算。那么抽样误差到底怎么计算呢?
在计算之前,同学们要澄清一个误会,以为抽样误差是一个综合指标,
其实不是。抽样误差的计算是针对具体变量的, 不是针对一项抽样的。同学们可以想一想,抽样的目的是为了
获得有代表性的样本,获得有代表性的样本是为了
用样本推论总体,误差尽可能的小,而推论是针对具体变量的推论。
可是任何一项调查,误差总是要体现在这个变量上的,
没有变量,哪来的误差呢。同理,抽样误差的计算也是针对具体变量的。
通常会用均值的变异系数来测量抽样误差。
比如,一个变量均值的 变异系数就等于标准误除上样本均值。
经验上,如果一项调查样本均值的变异系数小于百分之十五, 就认为质量是可以接受的。处二楼均值变异系数,
调查样本的质量参数还有相对方差。稍有统计学基础知识的同学就应该知道
这两者大致是一回事,反映的都是围绕着样本均值的变异程度, 只是一个用的标准误,一个用的方差。标准误就是
方差的开方值。当然在统计学上,它们的含义会有差异。
不过呢,对我们计算误差,两者之间的关系就是这样。
我们来看一下计算公式。
样本均值的变异系数就等于标准误除上样本均值。
样本均值的相对方差呢,就等于样本方差除上均值的平方。
如果是比例值,则样本比例的相对方差等于1减去抽样比,
在这里f就是抽样比,除上样本量减去1,再乘以
比例的乘积。详细的理论问题,大家可以参考在覆盖性误差一节所介绍的参考文献。
下边我们把这一节的内容做一个小结。
在抽样问卷调查中,抽样性误差主要来自于抽样设计和抽样两个环节的误差。
我们在这一节讨论的主要是抽样过程产生的误差,
尤其是末端抽样。比如说,设计中明确说明了采用右手抽样原则, 抽样员却不按规则办事,由此可能带来的误差。
在非抽样问卷调查中,没有严格意义上的抽样误差。不过呢,对调查对象的选择
同样会影响到结论,影响到对社会事实的归纳。
这一节的内容就到这里。下边我们把这一周的内容做一个小结。
调查数据的质量与分析结论的可靠性密切相关。
可以说数据质量是社会调查与研究质量的生命线。
在正向评估上,调查数据的质量指与研究设计、调查设计的符合性;
在负向评价上,指从设计到执行所产生的各种误差对分析研究的影响。
对调查数据误差的评估,
可以抽样问卷调查为理想模型,包括了覆盖性误差、测量性误差、应答性误差、 抽样性误差。
覆盖性误差指的是调查对象覆盖不准确所带来的误差。
覆盖性不准确既可能来自于研究设计,也可能来自于调查执行。
测量性误差,指测量工具不准、不可靠,以及测量过程不严格
所带来的误差。同样,既可能来自于测量设计,更多地
可能来自于测量过程。应答性误差指无应答带来的误差。影响无应答的因素就比较复杂了。
抽样性误差特指抽样调查中,由抽样因素,
比如抽样过程,所带来的误差。误差的详细计算方法可以参考课程中所提供的文献。
这一周的课程就到这里,谢谢大家!