各位同学大家好,那么流行病学研究中呢,最重要的一个挑战就是如何 来应对混杂和偏倚的问题。
同样的,在病例对照研究,我们也必须要来考虑
在整个研究的,无论从设计、 实施还是到分析阶段,可能会存在的这样的一些问题
所以我们下面就看一下,在病例对照研究中,有哪些主要的偏倚?那么
对这样一些主要的偏倚,我们如何去控制它,能尽可能的把它的影响降到最低?
那偏倚其实在前面已经介绍过,它主要是说在流行病学研究过程中
由于我们人为的原因,使得研究的结果 和真实的情况存在系统误差,这个就是偏倚
比如是一个,举一个最简单的例子,如果你这个打靶的时候,你的
枪的准星是歪的,虽然你的技术很好,每一次你觉得打的是十环
但是呢它都一定方向性的都偏到了八环,这个中间的差别 我们说就是一个系统的误差,这种就是一种偏倚的存在
那么这样偏倚的存在,它不能够通过我们多次的重复来进行改善,那种多次重复
可以改善的呢,是一随机的误差,系统误差那么只能靠我们去矫正这个准星
才能使你的靶打的更准,打的更好。
那在这个病例对照研究中,我们经常会碰到的偏倚呢 就是叫选择偏倚,信息偏倚和混杂偏倚
那它们分别是在研究的不同阶段产生出来的 选择偏倚,也就是说在研究设计阶段,由于
我们选择研究对象的方法有问题,使得你的入选者
还有落选者,没有选入的对象,他们在某些特征上存在着系统的差异
这样一来你通过这些,就是代表性不好的这些人群所得的结果呢,那么就会
你在外退的时候就会受到影响,也就是说它会降低研究的外部的真实性
啊那这个呢主要就是一种选择偏倚,那在病例对照研究中,经常可以看到的
选择偏倚呢,一个就是叫入院率偏倚,那么这个入院率偏倚因为是 Berkson
这个人 他最先提出来的,那么也就以他的名字呢 来命名叫 Berkson bias
那还有呢就是,当我们在前面提到了病例的类型 可以是新发,也可以呢有现患,那在这种选择新发现患
在这种情况下也可能会带来一种呢,叫新发现患偏倚,或者叫存活病例偏倚
呃,那这个呢,最早提出来并且证明这种偏倚存在的呢是 Neyman ,因此也用他的名字来命名的,叫
Neyman 偏倚 当然,我们在由于疾病的这个检出,他的这个因为某些特殊
症状导致他有一些病人更容易被检出,那这种呢是检出症候的偏倚
那在慢性病呢,因为他在不同的时间点进行诊断,可能 也会带来时间效应偏倚等等等等。
那么这些偏倚呢都属于 呃,我们在研究对象选择过程中,你的入选者和落选者之间系统误差
所带来的问题,那这里面呢呃比较常见的,就是我们经常在本科阶段 会讲的到就是
Berkson bias 和 Neyman bias,那 Berkson bias
呢就是这个 入院率偏倚,主要就是什么呢?当我们这个病例的选择是从
医院里面去选取,呃,对照也是从医院选取的时候,利用
医院病人作为病例对照的时候,由于不同的疾病,他的入院率是不一样的
那这种入院率的不同,就会导致呢你的病例组和对照组在某些特征上
存在系统差异,那这个呢就会带来呢这种入院率的偏倚 啊Neyman 偏倚是什么呢?就是当你以现患病例
作为你的研究对象,主要对象的时候呢,从现患病例得到的很多信息
它可能是跟存活相关,而不是跟这个疾病的发生相关,比如说这个我们前面
讲过,一个糖尿病的病人,十年前诊断的,你现在以他作为病例来进行研究
你调查他既往的历史,在这里面有很多的东西会发生 改变,那么我们得到的信息可能只是跟存活相关,而不是真正的
疾病发病的风险因素、 危险因素,这样一来,如果我们以现患病例作为
研究对象,就可能高估了某些暴露因素的病因作用
当然也存在着另外一种情况,就是如果一个人得了病之后,那么他因为得病
他会改变他的生活习惯,那也可能呢就会降低 他的某些危险因素的这种暴露的水平
或者也有可能呢,当他作为我们的被调查对象
就我们的研究对象的时候,当我们调查他的时候呢,他也可能会夸大
或者是缩小他病前的一些生活习惯,他的一些特征,这样呢在我们在研究
过程中也会导致呢某个因素和疾病的关联呢,带来系统的偏差,那这些呢都是
比较常见的这个选择偏倚,呃这个,那对于这些 呃,这个选择偏倚呢,我们后面也会讲到我们如何来进行控制
那第二大类偏倚,信息偏倚,实际上呢主要讲的就是在资料收集
阶段,由于我们测量这个暴露,或者测量结局的方法 有缺陷,那就会导致呢
各组之间,也会产生 系统的误差。
那这种情况呢,带来的就是一个信息偏倚 那这个信息偏倚呢,有的因为它是属于我们在测量过程中
来产生的,那么尤其是一些分类的测量,疾病暴露的分类测量
所以有的时候大家看一些书里面,呃他又把呢,信息偏倚又会给它另外一个名字,叫
错误分类偏倚等等,当然如果大家往更深入的学习呢,还会知道有差异性的错分
呃,有非差异性的错分,当然咱们在这个基础阶段呢,就不要求学这么多 那由于这个信息偏倚的存在呢,它会降低
研究的内部的真实性,呃这个呢是它带来的一个主要的影响 那信息偏倚呢,最常见的就是
回忆偏倚 Recall bais ,也就是研究对象在回忆某些因素的暴露史时
由于在准确性和完整性上,这个病例组和对照组 如果不一样,那么就会带来这种系统的误差。
比如说病例,因为他有病 他对既往的回忆史的暴露,可能呢他会非常认真嗯
会想了很多,甚至于也许会有夸大,而对照组因为他没有病
那因此,他也可能在既往的回忆上呢,也会存在着一些
偏差,这样一来,两组回忆不同,那就会带来一种回忆的偏倚
当然这种偏倚一方面来自被访对象,就是受调查的呃这个
受访对象,被调查者,也可能来自于什么呢?来自于我们
调查人员,就是我们的研究者,也可能会带来这些问题
比如说我们的研究人员,如果你对病例组和对照组
采用了不同的调查方式,呃你比如说病例组都是
面对面的去访式,去询问,而对照组呢,只是通过一个电话调查
那么这样一来收集的信息可能会存在着这样的系统误差
或者两个组用的这个设备是不一样的,病例组用了很
高精尖的这样的一些诊断测量的,这样的一些技术,而对照者呢可能只是一个询问
也会带来这样的一些信息的偏倚 那第三种呢,就是我们讲的混杂偏倚
混杂偏倚在前面也提到过,也就是在我们研究暴露和疾病的因果关系的时候呢
我们混入了一个外部的因素,而这个外部因素呢,它要满足什么呢?
它既跟暴露有关,也跟疾病有关,那这样的一个因素,我们就把它
叫做混杂因素,那如果这个混杂因素
它的这个分布在病例组和对照组,它的这个分布 是不一样的,那么它就可能呢会影响到
暴露和疾病之间的这种关联的强度,那由此就会带来了混杂偏倚
这个呢就是最,流行病学中一个非常经典的这样的一种偏倚类型
那怎么来判断一个因素,一个外部因素,它到底
是混杂还是不不是混杂呢?通常呢简单的讲我们大概呢要考虑
呃三个条件,一个就是说这个因素
它一定是所研究疾病的独立的危险因素,就是如果这个因素存在
它本身就可以导致这个疾病的发生,风险是增加的
那第二个呢就是说这个因素,它要还要跟你所研究的 你这一次研究关心的这个暴露因素,还要有关系
第三个呢还要考虑的就是说这个外部因素,它在你研究的那个暴露和疾病之间
这个因果链上它并不是一个中间的变量,呃在前面其实
其实我已经提到过了,我们以这个吸烟跟肺癌的研究为例 如果我们关心的这个暴露
E 他是吸烟 我们关心的这个发生的结局,疾病呢是肺癌,在我研究
暴露就是吸烟跟肺癌的关系的时候,如果这个年龄 在这里面,它可能就是一个混杂,为什么说年龄是混杂呢?
首先大家都知道,年龄越大的人,他罹患肿瘤的风险越高,所以年龄它本身就是
肿瘤的一个独立的危险因素,另外年龄跟这个吸烟的暴露之间
也是有关的,作为一个吸烟的人来讲,那么他这个年龄越大的话,如果他一直吸烟
他累计的暴露,他的暴露时间,暴露剂量都是越长越多的 所以它跟这个暴露之间也有关系。
还有一点,在我们研究这个吸烟跟肺癌的关系的时候呢
年龄并不是一个中间的这个变量,这样一来,在这个吸烟跟肺癌的研究中
年龄就形成了一个混杂的这样的一个因素,但是它会不会
带来混杂效应?还取决于呢 病例组和对照组年龄分布
是不是可比的,如果两个组的年龄分布可比,它不会带来 混杂偏倚,如果不可比的话,它就会带来一些混杂的偏倚
这个呢 就是关于混杂的问题,那当然对不同的这些个偏倚,我们应该在
研究设计,在具体的实施,和在分析阶段呢,采取相应的措施加以控制
就选择偏倚来讲,一般来说呢,首先要 充分地了解和掌握你要做的研究中,可能出现的
哪些选择偏倚,它是一个这个 Berkson bias? 还是一个 Neyman
bias?还是一个检出症候的偏倚?是哪一种?大概会出现什么样的? 那这个首先需要对各种偏倚有一个认识,对你的研究本身要有认识
那么还要呢,在研究对象的选择上,要严格地掌握它的纳入和排除的标准
那么我们还针对各家医院入院率的不同,那我们可能需要考虑呢
要多医院的选择研究对象,尽可能的采用新发病例
那么如果能够随机的时候,可以随机地选择研究对象 这些呢,都是我们控制选择偏倚的,可以采取的一些措施
那针对信息偏倚呢,那就是说如果你都对既往的暴露进行调查的时候
最好呢,是选择一些人们就是不容易忘记的,他记忆非常深刻的一些
重要的一些指标,或者是重要的一些个时间点来进行调查
这样让他回忆既往的历史的时候呢,他不容易出现呢这个记忆的模糊
那还有一点呢,就是我们要重视对于调查人员的培训,要对这个
无论是调查员他的这种调查的技术啊,调查的一致性啊,对他的责任心等等
都要经过呢严格的培训和考核,很多时候呢,我们还是需要呢 做这种一致性的
调查,来评价他是不是合格的,这样能够胜任的这样的一个调查员 这个呢
是对信息偏倚进行控制,那么关于混杂呢,可以在设计阶段
如果我们已经知道年龄是一个混杂,那我们可以在病例对照
研究的时候呢,我们可以采用限制的方法,我就界定好我什么样年龄的
进入到这个研究,超出的我就不再纳入,还可以是怎么样呢?我们可以采用匹配的方法
我让强制地让病例组和对照组,在年龄上是可比的
这个呢匹配可以是频数的匹配,也可以呢 按照配比的方法我们介绍过
1:1 的配对,还有呢 1:2;3;4
的,这样的一些配比的方式 那这个事先给他配好了,那这个年龄这个因素就不会产生这样混杂的影响
那当然很多时候我们可能在设计阶段是没有办法进行限制和匹配的,那我们在分析阶段呢- ,也可以
相应的呢 去采用分层分析,采用一些多因素的分析
甚至于呢 针对大量的混杂的时候,现在也有一些更新的技术
像倾向评分的方法等等等等,那么这样的一些分析的手段和方法呢,大家在
额深入的流行病学的研究,包括统计学的这个学习里面呢 也会学到这样的一些技术
总的来讲呢,作为一个病例对照研究,那么它是分析性流行病学的一个
基本的方法之一,那这种方法呢,它有 很好的优点我们已经讲到了,当你研究的时候,你的病例已经存在
你只要去找它的对照,回顾性地调查既往各种因素的暴露史,它可以短频快的
完成这样的一个研究,能够呢比较快的去概括病因假说 或者是检验病因假说。
所以这样的一种分析性的流行病学研究 方法呢,它特别适合于罕见病的这种
病因的研究,当然对一些常见病我们也可以用这种方法,但是如果你要是很常见的疾病,你要
不是时间很长的话,就是随访时间不需要很长,我们用 队列研究呢
可以得到呢 更好的这样因果的论证 那关于病例对照研究呢,基础部分就介绍到这里,好,谢谢大家!