流行病學(xué)/病例對(duì)照研究
醫(yī)學(xué)電子書 >> 《流行病學(xué)》 >> 流行病學(xué)分析性研究 >> 病例對(duì)照研究 |
流行病學(xué) |
|
(一)概說
病例對(duì)照研究(casecontrol study)是主要用于探索病因的一種流行病學(xué)方法。它是以某人群內(nèi)一組患有某種病的人(稱為病例)和同一人群內(nèi)未患這種病但在與患病有關(guān)的某些已知因素方面和病例組相似的人(稱為對(duì)照)作為研究對(duì)象;調(diào)查他們過去對(duì)某個(gè)或某些可疑病因(即研究因子)的暴露有無和(或)暴露程度(劑量);通過對(duì)兩組暴露史的比較,推斷研究因子作為病因的可能性:如果病例組有暴露史者或嚴(yán)重暴露者的比例在統(tǒng)計(jì)學(xué)上顯著高于對(duì)照組,則可認(rèn)為這種暴露與患病存在統(tǒng)計(jì)學(xué)聯(lián)系,有可能是因果聯(lián)系(圖4-1)。究竟是否是因果聯(lián)系,須根據(jù)一些標(biāo)準(zhǔn)再加以衡量判斷(詳見第七章“病因及其推斷”)。所謂聯(lián)系(associatiom)是指兩個(gè)或更多個(gè)變量間的一種依賴關(guān)系,可以是因果關(guān)系,也可以不是。
圖4-1 病例對(duì)照研究示意圖
例如,對(duì)一組肺癌病人(病例組)和一組未患肺癌但有可比性的人(對(duì)照組)調(diào)查他們的吸煙(暴露)歷史(可包括現(xiàn)在吸煙否,過去吸過煙否,開始吸煙年齡,吸煙年數(shù),最近每天吸煙支數(shù);如已戒煙則為戒煙前每日吸煙支數(shù),已戒煙年數(shù),等等)。其目的為通過比較兩組吸煙史的差別,檢驗(yàn)吸煙(可疑病因)與疾病(肺癌)有因果聯(lián)系的假設(shè)。這就是病例對(duì)照研究。
實(shí)例1.吸煙與肺癌的關(guān)系。
英國(guó)流行病學(xué)家A.B.Doll與R.Hill于1948~1952年進(jìn)行過一項(xiàng)病例對(duì)照研究。他們從倫敦20所醫(yī)院及其他幾個(gè)地區(qū)選取確診的肺癌1465例。每一病例按性別、年齡組、種族、職業(yè)、社會(huì)階層等條件匹配一個(gè)對(duì)照;對(duì)照系胃癌、腸癌及其他非癌癥住院病人,也是1465例。由調(diào)查員根據(jù)調(diào)查表詢問調(diào)查。經(jīng)分析數(shù)據(jù),得到的主要結(jié)果有:①肺癌病人中不吸煙者的比例遠(yuǎn)小于對(duì)照組:男性占0.3%,女性占31.7%;而對(duì)照組中男性不吸煙者占4.2%,女性占53.3%,差別均很顯著;②肺癌病人在病前10年內(nèi)大量吸煙者(≥25支/日)顯著多于對(duì)照組;③隨著每日吸煙量的增加,肺癌的預(yù)期死亡率。(推算出的年死亡率)也升高,例如男性45歲~64歲組日吸煙25~49支者與不吸煙者死亡率之比為2.94/0.14,即前者的率為后者的21倍;④肺癌病人與對(duì)照組比較,開始吸煙的年齡較早,持續(xù)的年數(shù)較多,而病例中已戒煙者的停吸年數(shù)也少于對(duì)照組中已戒煙者。
以后,Hill,Doll,Peto等又用前瞻性隊(duì)列研究法深入研究,經(jīng)長(zhǎng)達(dá)20年(女性經(jīng)22年)的觀察,更加令人信服地提示出吸煙為肺癌的主要病因以及吸煙對(duì)健康的其他多種危害。他們的結(jié)論已為其他許多研究所證實(shí),成為許多國(guó)家提倡不吸煙、限制吸煙及限制卷煙銷售政策的科學(xué)基礎(chǔ)。
病例對(duì)照研究是最常用的分析流行病學(xué)方法。因其需要的調(diào)查對(duì)象數(shù)目較少,人力、物力都較節(jié)省,獲得結(jié)果較快,并且可由臨床醫(yī)生在醫(yī)院內(nèi)進(jìn)行。對(duì)于少見病的病因研究,常為唯一可行的方法。但這些優(yōu)點(diǎn)都是與前瞻性隊(duì)列研究相對(duì)而言的,實(shí)際上倘與同等規(guī)模的臨床研究或?qū)嶒?yàn)室研究比較,病例對(duì)照研究所費(fèi)的時(shí)間與精力可能更多。
本書以臨床醫(yī)學(xué)專業(yè)學(xué)生為主要讀者,并不要求他們能掌握或獨(dú)立應(yīng)用分析流行病學(xué)方法,目標(biāo)只是了解大概、擴(kuò)大眼界、培養(yǎng)科學(xué)思辨能力,領(lǐng)會(huì)科學(xué)上獲得一個(gè)發(fā)現(xiàn)或作出一個(gè)結(jié)論的復(fù)雜過程及需要的客觀態(tài)度。
病例對(duì)照研究是從現(xiàn)在是否患有某種疾病出發(fā),回溯過去可能的原因(暴露),在時(shí)間順序上是逆向的,即是從“果”推求“因”,所以又稱回顧性調(diào)查、研究。
病例對(duì)照研究(及其他類型的流行病學(xué)研究)中所謂的暴露(exposure)是指研究對(duì)象(病例或?qū)φ眨┚哂心撤N疑為與患病與否可能有關(guān)的特征或曾受到某種疑為與患病與否可能有關(guān)的因子的影響。所謂特征(characteristic)可以是體質(zhì)上的、生理上的、也可是心理精神上的;即可以是遺傳性的也可以是獲得性的;所謂因子(因素)既可以是外界的也可以是機(jī)體內(nèi)在的;特征或因子可以是致病性的,也可以是保護(hù)性的(使人免于患病的)。因此,“暴露”是一個(gè)涵義廣泛的概念。
(二)方法
1.樣本含量的估計(jì) 為了研究一種暴露與疾病的關(guān)系需要多大一個(gè)樣本,也就是需要多少個(gè)病例和多少個(gè)對(duì)照,首先取決于4個(gè)條件:①人群中暴露者的比例;②假定暴露造成的相對(duì)危險(xiǎn)度(其涵義詳見后文);③要求的顯著性水平;④要求的把握度。從這4個(gè)條件估算樣本的含量的方法,詳見附錄五。實(shí)際上,樣本含量還受許多因素的制約,例如病例和對(duì)照的來源、財(cái)力、人力、完成期限等。假定只有一定數(shù)目的病例與對(duì)照可以利用,則一個(gè)研究能查出的最小相對(duì)危險(xiǎn)度是多少?又假定經(jīng)費(fèi)數(shù)目已限定,則應(yīng)選多少個(gè)病例與對(duì)照才能取得最大的把握度,這些都是應(yīng)考慮的問題。此外,評(píng)價(jià)交互反應(yīng),控制混淆因素,亞組分析,每例多個(gè)對(duì)照等均影響所需樣本的大小。
2.病例和對(duì)照的來源與選擇
(1)病例:主要有兩種來源:①?gòu)尼t(yī)院病人選擇,即是從某一所或若干所醫(yī)院選擇某時(shí)期內(nèi)就診或住院的某種病的全部病例。病例應(yīng)符合統(tǒng)一的、明確的診斷標(biāo)準(zhǔn)。最好是新發(fā)生的(新診斷的)病例。因?yàn)橐环N病的全部病例不大可能都有進(jìn)入某一所或幾所醫(yī)院的同等機(jī)會(huì),能進(jìn)入的只是其中符合條件(即選擇因素)的那一部分,所以不要求能代表某時(shí)某地的全部病例,但應(yīng)要求能代表產(chǎn)生病例的人群,即該人群只要發(fā)生該種病例均可能進(jìn)入該院。這樣,結(jié)果的普遍性雖受限,但真實(shí)性不受影響,而真實(shí)性是普遍性的前提。這種研究稱為以醫(yī)院為基礎(chǔ)的(hospital-based)病例對(duì)照研究;②從某特定人群選擇病例,即是以符合某一明確規(guī)定的人群在某時(shí)期內(nèi)(一年或幾年,視病例發(fā)生多少而定)的全部病例或當(dāng)病例數(shù)過多時(shí)以其中的一個(gè)隨機(jī)樣本作為研究對(duì)象。其優(yōu)點(diǎn)是選擇偏倚比前一種來源的小,結(jié)論推及該人群的可信程度較高。這種研究稱為以人群為基礎(chǔ)的(population-based)病例對(duì)照研究。
(2)對(duì)照:設(shè)立對(duì)照的目的在于估計(jì)如果疾病與暴露無聯(lián)系,則病例組的暴露率可能為多少,也就是為比較提供一個(gè)基準(zhǔn)。因此,對(duì)照與病例在一些主要方面必須具可比性。首先,對(duì)照必須從病例所來自的人群選擇,對(duì)照是有可能成為病例的人,換言之,每一病例在未發(fā)病前應(yīng)該是合格的對(duì)照,而每一對(duì)照若發(fā)病都有可能成為病例組的成員。對(duì)照選擇是否恰當(dāng)是病例對(duì)照研究成敗關(guān)鍵之一。
通常的做法是:如果病例組來自某一特定人群,則可以該人群的非病例(即未患該種疾病的人)的一個(gè)隨機(jī)樣本作對(duì)照;如果病例來自某所醫(yī)院,則可從同醫(yī)院同時(shí)就診或住院的其他病例中選擇對(duì)照。要求對(duì)照具有和病例一致的某些特征,即對(duì)照與病例有可比性,例如性別、年齡、居住地等;同時(shí)要求對(duì)照沒有患和研究因子與研究疾病有關(guān)的其他疾病的可能。例如,研究吸煙與肺癌的關(guān)系時(shí),不能以慢性支氣管炎病人為對(duì)照,因?yàn)槲鼰熗瑫r(shí)是這兩種病的可能病因;研究胃癌的病因不能以“慢性胃炎”病人為對(duì)照,因?yàn)檫@兩種病在病因上有密切關(guān)系,前者可能是后者在病因鏈上的一環(huán)。上述要求的目的都是減少混淆偏倚。其他來源的對(duì)照如病例的鄰居、同事、親屬等。各種不同來源的對(duì)照要解決的問題不同,都各有其局限性。例如,鄰居對(duì)照可控制社會(huì)經(jīng)濟(jì)地位的混淆作用,兄弟姊妹對(duì)照是考慮控制早期環(huán)境的影響和遺傳因素的混淆作用(極端要求為用同卵孿生),配偶對(duì)照是主要考慮成年期環(huán)境的影響。最常采用的方式是對(duì)照和病例都選自同一醫(yī)院,因?yàn)槔碚撋纤麄兌紒碜栽撫t(yī)院所服務(wù)的同一人群,而且對(duì)兩者都可在相同的環(huán)境中進(jìn)行調(diào)查,也易于合作。但是由于不同病種的患者入院的機(jī)會(huì)不同,有可能使本來與某病無關(guān)的特征在醫(yī)院病例中表現(xiàn)出虛假的聯(lián)系(詳見第七章“病因及其推斷”)。為了減少這種偏倚發(fā)生的可能性,應(yīng)該選取多種疾病而不是一種疾病的病人作對(duì)照。
3.病例與對(duì)照的配合 設(shè)置對(duì)照的作用在于平衡除了研究因子(暴露)以外的其他可能影響患病的因素,也就是說如果暴露與所研究的疾病不存在聯(lián)系的話,病例的暴露比例(率)應(yīng)該與對(duì)照的無顯著差別;如果發(fā)現(xiàn)顯著差別,既然對(duì)照與病例在其他有關(guān)方面都可比較,因此可以推斷患病與否可能是與暴露率的差別有聯(lián)系。為使兩者具可比性,首先可以通過限制選擇病例與對(duì)照的范圍(例如年齡范圍、性別、種族等),使有關(guān)因子盡可能齊同。病例組與對(duì)照組的某些特征不應(yīng)存在顯著差別,即應(yīng)該均衡。
另一個(gè)選擇對(duì)照的重要方法叫匹配(matching,曾譯“配比”),又稱匹配抽樣(matchedsampling),就是在安排病例與對(duì)照時(shí),使兩者的某些特征或變量相一致。具體做法有兩種:一種叫成組匹配或頻數(shù)匹配,即在選擇好一組病例之后,在選擇對(duì)照組時(shí)要求其某些特征或變量的構(gòu)成比例與病例組的一致(即在兩組的總體分布一致),例如性別、年齡構(gòu)成一致,具體做法上類似分層抽樣。另一種做法叫個(gè)別匹配,就是以每一病例為單位,選擇少數(shù)幾個(gè)特征或變量方面與病例一致的一個(gè)或幾個(gè)對(duì)照者組成一個(gè)計(jì)數(shù)單位或計(jì)數(shù)和分析單位。一個(gè)病例匹配一個(gè)對(duì)照的(即1:1匹配)一般稱為配對(duì),也就是說由一個(gè)病例和一個(gè)對(duì)照組成對(duì)子(pair)為一個(gè)計(jì)數(shù)單位。
個(gè)別匹配,特別是1:1匹配,最常被采用。理論上,一個(gè)病例可以匹配多個(gè)對(duì)照,但研究證明病例與對(duì)照之比超過1:4時(shí),統(tǒng)計(jì)效率不會(huì)明顯增加,但工作量卻增大。如果病例與對(duì)照來源都充足,調(diào)查費(fèi)用又差不多,則以1:1匹配最合適;如果病例數(shù)有限而對(duì)照易得,則可采用一個(gè)病例匹配幾個(gè)對(duì)照的辦法以提高統(tǒng)計(jì)效率(例如實(shí)例2)。
在病例對(duì)照研究中采用匹配的目的,首先在于提高研究效率(study efficiency),表現(xiàn)為每一研究對(duì)象提供的信息量的增加。匹配后再按匹配的因素進(jìn)行分層分析,可使每一個(gè)匹配層中都有一定數(shù)目的病例與對(duì)照,不至于因有的層只有病例有的層只有對(duì)照而無法對(duì)比,不能提供信息。其次,在于控制混淆因素的作用。所以匹配的特征或變量必須是已知的混淆因子,至少也應(yīng)有充分的理由這樣懷疑,否則不應(yīng)匹配。
無論是否采用匹配設(shè)計(jì),為控制混淆作用都須在分析階段用分層、標(biāo)準(zhǔn)化或多元分析,但匹配后再按匹配因素作分層分析可以提高分析的效率,也就是提高了控制混淆因素的效率。
但是匹配也要付出代價(jià):匹配增加了尋找對(duì)照的速度,以同樣的低價(jià)也許可以得到更多不匹配的對(duì)照,從而擴(kuò)大樣本含量。從這個(gè)意義上說,匹配又降低了研究效率。增加匹配項(xiàng)目又會(huì)導(dǎo)致可能作為對(duì)照者的減少,無法找到可匹配對(duì)照的病例只得被剔除;一個(gè)項(xiàng)目一經(jīng)匹配不但使它與疾病的關(guān)系不能分析而且使它與其他研究因子的交互作用也不能充分分析。把不必要的項(xiàng)目列入匹配,企圖使病例與對(duì)照盡量一致,如果匹配的因素與暴露有聯(lián)系,就可能人為地造成更多的病例與對(duì)照暴露史一致的對(duì)子,徒然丟失信息,增加工作難度的結(jié)果反而是降低了研究效率。這種情況稱為匹配過度(over-matching),應(yīng)注意避免。
匹配的變量應(yīng)一致到什么程度,取決于變量的性質(zhì)、實(shí)際可能與必要:離散變量(即屬性,無中間值的變量)可以完全匹配,連續(xù)變量(在一定范圍內(nèi)可取任何值的變量)往往劃分為若干類或組,再按此匹配。例如按年齡分組、按血壓分組、按吸煙量分組匹配。分得太細(xì),會(huì)增加工作難度,也不一定必要,例如年齡要求同歲;但分得太粗,例如年齡按10歲分組,又達(dá)不到控制混淆作用的目的。
當(dāng)估計(jì)有許多可能的混淆因素需要控制時(shí),倘僅靠分層則因?qū)訑?shù)太多不能保證每層均有病例與對(duì)照,所以采用匹配以保證有效的分層分析。其次,有的列名變量包含許多類別或內(nèi)容復(fù)雜(例如職業(yè)、種族、居住地、籍貫、兄弟姊妹等),如是可能的混淆因子,應(yīng)加匹配。否則單靠分層不能控制混淆作用。
匹配可保證對(duì)照與病例在某些重要方面的可比性。對(duì)于小樣本研究以及因?yàn)椴±哪撤N構(gòu)成(例如年齡、性別構(gòu)成)特殊,隨機(jī)抽取的對(duì)照組很難與之平衡時(shí),個(gè)別匹配最為有用。
一般除性別、年齡之外,對(duì)于其他因素是否列入匹配須持慎重態(tài)度,以防止匹配過頭及徒增費(fèi)用和延長(zhǎng)完成時(shí)間。
4.計(jì)劃和執(zhí)行 病例對(duì)照研究在制訂計(jì)劃和執(zhí)行時(shí)應(yīng)注意以下問題:
(1)主要假設(shè)的說明是否清楚、簡(jiǎn)明而且可以檢驗(yàn)?
(2)疾病與暴露變量的定義清楚、明確否?
(3)是否擬探索劑量反應(yīng)關(guān)系和多個(gè)危險(xiǎn)因素的聯(lián)合作用?
(4)為解答問題所需之病例數(shù)和對(duì)照數(shù)能否得到?這樣大小的樣本能查出的最小相對(duì)危險(xiǎn)度是多少?與估計(jì)的相差多少?[參考附錄五(四)節(jié)]。
(5)病例來源及抽樣技術(shù)明確否?病例數(shù)與對(duì)照數(shù)之比是多少?匹配否及匹配哪些變量?
(6)調(diào)查表(問卷)是否已包括打算測(cè)量的所有變量并能夠收集到需要的數(shù)據(jù)?其詳盡程度是否已足供分析之用?
(7)醫(yī)院記錄(病歷)及其他來源的信息、從體檢、實(shí)驗(yàn)室檢查、病理切片等獲得的數(shù)據(jù)需表格記錄否?
(8)調(diào)查表經(jīng)過試用否?其真實(shí)度與可靠度(重復(fù)性)經(jīng)評(píng)估否?訪問時(shí)擬使用幫助回憶的實(shí)物、模型或圖片否?
(9)調(diào)查員、質(zhì)控員、病歷摘錄員、編碼員的工作手冊(cè)已編好否?須專門培訓(xùn)否?
(10)組織機(jī)構(gòu)、人員、設(shè)備、經(jīng)費(fèi)落實(shí)否?
(11)協(xié)作單位有書面協(xié)議否?有關(guān)領(lǐng)導(dǎo)機(jī)關(guān)已批準(zhǔn)否?將診斷根據(jù)(切片、標(biāo)本、影像圖片等)送到主持單位復(fù)核安排妥當(dāng)否?
(12)實(shí)驗(yàn)室檢驗(yàn)項(xiàng)目或用儀器檢測(cè)的項(xiàng)目所用儀器、方法、試劑是否符合標(biāo)準(zhǔn)?結(jié)果的真實(shí)度與可靠度經(jīng)過考核否?
(13)經(jīng)治醫(yī)院、醫(yī)生是否同意提供病例和對(duì)照?是否必須取得研究對(duì)象在了解情況后的書面同意?資料、數(shù)據(jù)怎樣保密?怎樣保存?
5.數(shù)據(jù)分析 須分析什么項(xiàng)目,計(jì)算哪些統(tǒng)計(jì)量,用什么統(tǒng)計(jì)學(xué)方法,用手工(計(jì)算器)還是計(jì)算機(jī),如用后者怎樣建數(shù)據(jù)庫(kù)和用什么軟件包,等等,都應(yīng)包括在設(shè)計(jì)之中,手工計(jì)算時(shí)還應(yīng)擬好相應(yīng)表格。現(xiàn)在計(jì)算機(jī)及統(tǒng)計(jì)軟件包的應(yīng)用漸趨普及,過去很難進(jìn)行的一些復(fù)雜的統(tǒng)計(jì)檢驗(yàn)現(xiàn)在很快就可完成并打印出結(jié)果還可繪出統(tǒng)計(jì)圖。但是,一些流行病學(xué)專家主張先用手工計(jì)算基本內(nèi)容以熟悉數(shù)據(jù),然后再由計(jì)算機(jī)作復(fù)雜運(yùn)算(多元分析)。
本節(jié)要介紹的是基本原理和基本方法,無論用手工或機(jī)器運(yùn)算,這些都是應(yīng)熟悉的。
病例對(duì)照研究數(shù)據(jù)分析的中心內(nèi)容是比較病例和對(duì)照中暴露的比例并由此估計(jì)暴露與疾病的聯(lián)系程度,并估計(jì)差別與聯(lián)系由隨機(jī)誤差造成的可能性有多大,特別要排除由于混淆變量未被控制而造成虛假聯(lián)系或差異的可能。進(jìn)一步,還可計(jì)算暴露與疾病的劑量反應(yīng)關(guān)系,各因子的交互作用(對(duì)一種因子的暴露會(huì)不會(huì)影響對(duì)另一種因子的效應(yīng)),等等。非匹配和匹配設(shè)計(jì)的研究,數(shù)據(jù)的分析方法有一些不同。
(1)非匹配數(shù)據(jù)的分析:首先要檢驗(yàn)病例組與對(duì)照組在某些主要特征(即可能成為混淆因子的特征)的構(gòu)成上是否沒有顯著差別(均衡性檢驗(yàn))。
1)聯(lián)系的顯著性與聯(lián)系強(qiáng)度:某個(gè)因素與某種結(jié)局(患病或死亡)之間的聯(lián)系是否有統(tǒng)計(jì)學(xué)顯著性,常用χ2檢驗(yàn)。最簡(jiǎn)單的情況是因素與結(jié)局都只分為“有”或“無”兩類,數(shù)據(jù)可納入一張2×2表(即四格表,又稱四格列聯(lián)表),例如表4-1。χ2檢驗(yàn)可用四格表專用公式(式4-1)。但χ2值的大小并不表示聯(lián)系的強(qiáng)度。χ2≥3.84時(shí),設(shè)兩者無聯(lián)系的假設(shè)(無效價(jià)設(shè),H0)被否定,而轉(zhuǎn)向存在聯(lián)系的假設(shè)(備擇假設(shè),HA),這個(gè)判斷錯(cuò)誤的可能性為≤0.05(即ρ≤0.05)。χ2值越大,判斷錯(cuò)誤的可能性越小。
表4-1 危險(xiǎn)因子與疾病的聯(lián)系
患病 | 有暴露史 | 無暴露史 | 合計(jì) |
有 | a | b | a+b |
無 | c | d | c+d |
合計(jì) | a+c | b+d | a+b+c+d=n |
統(tǒng)計(jì)學(xué)顯著性可以評(píng)價(jià)在多大程度上可用機(jī)會(huì)解釋所觀察到的聯(lián)系。但如數(shù)據(jù)本身存在系統(tǒng)誤差,統(tǒng)計(jì)學(xué)顯著性檢驗(yàn)就無意義,因?yàn)樗荒軈^(qū)別聯(lián)系的真或假(由偏倚、混淆所致的聯(lián)系)。此外,統(tǒng)計(jì)學(xué)顯著性檢驗(yàn)結(jié)果極大地受樣本含量的影響,樣本小則隨機(jī)變異大;即使實(shí)際上暴露的作用很大,也會(huì)導(dǎo)致“不顯著”的結(jié)論。所以“不顯著”應(yīng)理解為“不足以否定無效假設(shè)”。
現(xiàn)況調(diào)查和隊(duì)列研究(見本章“二、隊(duì)列研究”)可以計(jì)算暴露者(或具某特征者)和未暴露者(或不具某特征者)的患病率或發(fā)病率,因?yàn)?a href="/w/%E5%88%86%E5%AD%90" title="分子">分子數(shù)與分母數(shù)是已知的。也可以計(jì)算相對(duì)危險(xiǎn)度(見本章公式4-11)。這是聯(lián)系強(qiáng)度的一個(gè)指標(biāo)。
但是病例對(duì)照研究因?yàn)椴荒苡?jì)算出患病率或發(fā)病率所以不能計(jì)算相對(duì)危險(xiǎn)度,但可用另一個(gè)聯(lián)系強(qiáng)度指標(biāo)——比數(shù)比(odds ratio,又譯比,值比、優(yōu)勢(shì)比,縮寫為OR)。比數(shù)比是兩個(gè)比數(shù)之比。比數(shù)(odds)是表示一個(gè)事件發(fā)生機(jī)會(huì)大小的一種指標(biāo)。以表4-1為例(字母代表數(shù)目),如果是隊(duì)列研究與現(xiàn)況調(diào)查,可以計(jì)算發(fā)?。ɑ蚧疾。┍葦?shù),暴露組的這個(gè)比數(shù)為α/c,未暴露組的這個(gè)比數(shù)為b/d。如果是病例對(duì)照研究,可以計(jì)算暴露比數(shù),在病例組是α/b,在對(duì)照組是c/d。兩組比數(shù)之比稱為比數(shù)比,
OR =(α/b)/(c/d)=αd/bc
或
OR =(α/c)/(b/d)= αd/bc.(式4-2)
這個(gè)比正好是四格表中兩條對(duì)角線上四個(gè)數(shù)字的交叉乘積αd與bc之比,所以四格表數(shù)據(jù)的OR又稱交叉乘積比。OR可用于隊(duì)列研究,但更重要的是用于病例對(duì)照研究。在少見病,OR可以當(dāng)作RR去解釋,即OR近似于RR。因在此情況下總體內(nèi)不論暴露組或未暴露組中患病者的人數(shù)(分別記為A與B,用大寫字母區(qū)別于樣本數(shù)據(jù)的小寫字母)都遠(yuǎn)少于未患病者的人數(shù)(C與D),所以在總體內(nèi)A+C→C,B+D→D,于是
因?yàn)閺碾S機(jī)樣本的α/c與b/d可以估計(jì)A/C或B/D,所以可用αd/bc估計(jì)AD/BC,也就是說可以用OR作為RR的估計(jì)值。
暴露組與未暴露組的發(fā)病率或死亡率之比稱為率比(rate ratio)。兩組發(fā)病概率之比稱為危險(xiǎn)度比(risk ratio)。在少見病,這兩個(gè)比和比數(shù)比均近似,可統(tǒng)稱為相對(duì)危險(xiǎn)度。
從OR(或RR)值可估計(jì)暴露與疾病的聯(lián)系程度。這種聯(lián)系的穩(wěn)定性,即隨機(jī)變異的大小可用顯著性檢驗(yàn)的ρ值和可信限來估計(jì)。OR是用來估評(píng)暴露與疾病的聯(lián)系程度或即暴露作用強(qiáng)度的一個(gè)點(diǎn)估計(jì)值(0~∞),但為估計(jì)這個(gè)值受隨機(jī)變異影響的程度,最好同時(shí)算出可能包括真值(參數(shù))的一個(gè)取值范圍,表示以一定程度的信心估計(jì)參數(shù)值所在的范圍,稱為可信限或可信區(qū)間(confidence interval)。計(jì)算方法詳見附錄五。如果可信限包括了無效值(OR=1),說明該聯(lián)系無顯著性;可信限的寬度又反映點(diǎn)估計(jì)值(OR)的穩(wěn)定性,范圍寬說明估計(jì)值不穩(wěn)定,也就是隨機(jī)變異程度大。所以現(xiàn)在認(rèn)為僅計(jì)算出點(diǎn)估計(jì)值的意義有限,應(yīng)同時(shí)計(jì)算出其可信限。
2)分層數(shù)據(jù)分析:病例對(duì)照研究在設(shè)計(jì)階段可采用的控制混淆因素的方法有限制與匹配。限制是指對(duì)采用研究對(duì)象的范圍加以限制,如混淆因素為列名變量(離散變量)可限定只采用某一類或幾類對(duì)象(例如性別、職業(yè)、地區(qū)等),如為連續(xù)變量可限定只采用某一范圍內(nèi)(例如年齡組、段)的對(duì)象。其目的都是得到比較勻質(zhì)的研究對(duì)象。如果一個(gè)因素在各對(duì)象間無差別或差別很小,它就不可能起到混淆作用,也就是得到了控制??稍诜治鲭A段采用的控制混淆因素的方法有分層、標(biāo)準(zhǔn)化和多元分析。其中以分層分析最常用。
分層就是把樣本按照一個(gè)或更多個(gè)混淆因子的暴露有無或作用程度而劃分為若干個(gè)組,也就是“層”,再分別在每一層內(nèi)分析所研究暴露與疾病的聯(lián)系,計(jì)算各層的比數(shù)比(記為OR);
表4-2 第i層內(nèi)病例與對(duì)照按暴露有無分組
組別 | 病倒 | 對(duì)照 | 合計(jì) |
暴露 | αi | bi | m1i |
未暴露 | ci | di | m0i |
合計(jì) | n1i | n0i | ni |
如果各層 具有齊性[齊性檢驗(yàn)方法見附錄五(一)],則可以計(jì)算總的即各層OR的合并OR。因其方法系Mantel與Haenszel兩人所開發(fā),所以通常記作ORMH。因在同一層內(nèi)作為分層標(biāo)志的因子對(duì)病例組與對(duì)照組的作用都是相同的,所以對(duì)所研究的暴露與疾病的聯(lián)系便不會(huì)發(fā)生混淆作用。其原理與匹配相同,實(shí)際上1:1匹配就是一種最細(xì)的分層,每層只包括一個(gè)病例與一個(gè)對(duì)照。合并OR是概括各層OR的一個(gè)指標(biāo)。
合并OR的計(jì)算方法:
ORMH可信限的計(jì)算方法及計(jì)算實(shí)例見附錄五(一)。
ORMH如果不等于1,那么與1的差異是否顯著?可用作顯著性檢驗(yàn),其方法如下:
式中,ai=各層四格表中的a數(shù)值,
檢驗(yàn)假設(shè)(即無效假設(shè))Ho:OR=1,雙側(cè)備擇假設(shè)HA:OR≠1。統(tǒng)計(jì)量X2MH呈自由度為1的X2分布。
分層分析法舉例:某地進(jìn)行了一次食管癌病因的病例對(duì)照研究,共調(diào)查病例200例,人群對(duì)照776例。現(xiàn)分析其中飲酒與食管癌的聯(lián)系,結(jié)果如表4-3。
表4-3 飲酒與食管癌的聯(lián)系
飲酒史 | 病倒數(shù) | 對(duì)照數(shù) | 合計(jì) |
飲 酒 | 171 | 381 | 552 |
不飲酒 | 29 | 395 | 424 |
合計(jì) | 200 | 776 | 976 |
OR=6.11 χ2=84.29
可見飲酒與食管癌有強(qiáng)聯(lián)系,但已知吸煙與食管癌也有強(qiáng)聯(lián)系。為了分析飲酒與食管癌顯示出的強(qiáng)聯(lián)系是否可能與吸煙有關(guān),或吸煙是否可能是一個(gè)混淆因子,可采用分層分析:按是否吸煙分為兩組,再分析飲酒與食管癌的聯(lián)系,結(jié)果見表4-4。
表4-4 飲酒與食管癌在吸煙與不吸煙者的聯(lián)系
不吸煙者 | 吸煙者 | ||||||
飲酒史 | 病倒 | 對(duì)照 | 合計(jì) | 飲酒史 | 病倒 | 對(duì)照 | 合計(jì) |
飲 酒 | 69 | 191 | 260 | 飲酒 | 102 | 190 | 292 |
不飲酒 | 9 | 257 | 266 | 不飲酒 | 20 | 138 | 158 |
合計(jì) | 78 | 448 | 526 | 合計(jì) | 122 | 328 | 450 |
OR=10.3 χ2=53.99 OR=3.70 χ2=24.62
計(jì)算ORMH,先用公式(4-3)計(jì)算
再用公式(4-4)作χ2檢驗(yàn):
χ2MH=76.84
ρ<0.00000001。用附錄五公式(附式5-1)計(jì)算ORMH的95%可信限,上限為8.09,下限為3.81。用附錄五(一)的Woolf法作各層ORi的齊性檢驗(yàn),結(jié)果說明各層間的OR差異顯著,來自同一總體的可能性很小,所以O(shè)RMH不能說明吸煙、飲酒與食管癌的聯(lián)系,因此是無意義的。這種齊性檢驗(yàn)可同時(shí)檢驗(yàn)各因素間是否存在交互作用。本例的計(jì)算過程及結(jié)果解釋見附錄五(一)的計(jì)算實(shí)例。
以上關(guān)于分析方法的介紹,都是以暴露有無和疾病有無這種最簡(jiǎn)單的兩分變量為例。實(shí)際情況常較此復(fù)雜,有必要時(shí)讀者可參考專書。
多個(gè)混淆因子如用分層法同時(shí)控制多個(gè)混淆因子,則分成的層數(shù)將很多(例如,年齡分組,性別分組,吸煙與否2組,就已有20層),在樣本含量不是特別大的情況下,每層的人數(shù)將劇減,而且各層中病例數(shù)與對(duì)照數(shù)或與未暴露者數(shù)目的比例波動(dòng)很大,可能出現(xiàn)只有病例而無對(duì)照或相反以及人數(shù)為零的層,以致統(tǒng)計(jì)效率降低,信息丟失。這時(shí)應(yīng)采用多元分析法解決問題?,F(xiàn)在借助電子計(jì)算機(jī)及軟件包,已可使過去用手工計(jì)算很難進(jìn)行的幾種方法成為普及。多元分析法在樣本不是極大的情況下可同時(shí)控制多個(gè)變量的作用而不影響研究效率?,F(xiàn)在應(yīng)用十分廣泛的是多元logistic回歸分析。
(2)匹配數(shù)據(jù)的分析:本書只以1:1匹配的數(shù)據(jù)為例。數(shù)據(jù)分析的程序基本上與非匹配數(shù)據(jù)相同。
1)檢驗(yàn)病例與對(duì)照的暴露比例是否有顯著差別:就每一對(duì)中的病例與對(duì)照的暴露史而言,可能有四種組合情況(頻數(shù)記為f ,有暴露記為下標(biāo)1,無暴露記為下標(biāo)0):①病例有暴露,對(duì)照也有暴露(記為f11);②病例有暴露,對(duì)照無暴露(f10);③病例無暴露,對(duì)照有暴露(f01);④病例與對(duì)照都無暴露(f00)。只有這四種組合,而且四者必居其一。設(shè)四種情況的對(duì)子各有f11,f10,f01,f00對(duì),則全部數(shù)據(jù)可用一張四格表歸納(表4-5)。每格的數(shù)字代表對(duì)子數(shù)。
設(shè)暴露與患病無聯(lián)系,即H0:OR=1,x2檢驗(yàn)用下式:
表4-5 配對(duì)數(shù)據(jù)的四格表
病倒 | 對(duì)照 | 合計(jì) | |
暴露 | 未暴露 | ||
暴 露 | f11 | f10 | f11+f10 |
未暴露 | f01 | f00 | f01+f00 |
合計(jì) | f11+f01 | f10+f00 | N |
自由度=1。此式適用于較大樣本。
2)比數(shù)比及其可信限的計(jì)算:只有病例與對(duì)照暴露史不相同的對(duì)子(f10與f01),才能提供關(guān)于暴露與疾病聯(lián)系程度的信息。
OR=f10/f01(f01≠0時(shí))(式4-6)
OR可信限可用附錄五公式(附式5-1)計(jì)算。
實(shí)倒1:有一項(xiàng)調(diào)查心肌梗死與高血壓的關(guān)系的病例對(duì)照研究,用1:1匹配設(shè)計(jì),以收縮壓(SBP)≥18.6kPa(140mmHg)為高血壓。數(shù)據(jù)如表4-6(虛構(gòu))。
表4-6 高血壓與心肌梗死的病例對(duì)照研究
心肌梗死病倒 | 對(duì) 照 | 合計(jì) | |
SBP≥18.6 | SBP<18.6 | ||
SBP≥18.6 | 15 | 60 | 75 |
SBP<18.6 | 35 | 40 | 75 |
合計(jì) | 50 | 100 | 150 |
用公式(式4-5)作卡方檢驗(yàn):
用公式(式4-6)計(jì)算OR:
OR=60/35=1.71
用附錄五公式(附式5-1)計(jì)算OR的95%可信限:
計(jì)算結(jié)果說明高血壓與心肌梗死有中等程度的聯(lián)系(OR=1.71)。高血壓患者患心肌梗死的危險(xiǎn)度較非高血壓者約高出70%。OR的可信限不包括1,說明OR值有顯著性。
(3)人群歸因危險(xiǎn)度:在一定條件下,從病例對(duì)照研究結(jié)果可以算出人群歸因危險(xiǎn)度,詳見“隊(duì)列研究”。
(三)病例對(duì)照研究的偏倚
偏倚問題將在第七章詳細(xì)討論。三種主要偏倚,即選擇偏倚、信息偏倚、混淆偏倚,在病例對(duì)照研究都可能發(fā)生。特別是選擇偏倚,在醫(yī)院為基礎(chǔ)的病例對(duì)照研究更易發(fā)生。又因作為一種回顧性調(diào)查,特別易受回憶偏倚(信息偏倚的一種)的影響,因?yàn)楸┞妒分饕氁揽勘徽{(diào)者的回憶,但一些復(fù)雜煩鎖的問題(如膳食史)很難正確回憶;一些被認(rèn)為可能與患病有關(guān)的暴露史,病例易高估,對(duì)照易低估。如果調(diào)查員知道誰是病例誰是對(duì)照以及病因假設(shè),則易于在調(diào)查時(shí)態(tài)度不同、重點(diǎn)不同,產(chǎn)生誘導(dǎo)作用,從而造成偏倚,稱為調(diào)查員偏倚。這些都是在設(shè)計(jì)、執(zhí)行和分析時(shí)應(yīng)加預(yù)防和處理的。
實(shí)例2:女青年陰道腺癌(vaginal adenocarcinoma)和母親妊娠期服用已烯雌酚關(guān)系的研究。美國(guó)波士頓婦產(chǎn)科醫(yī)生AL Herbst注意到1966~1969年期間在該市Vincent紀(jì)念醫(yī)院診斷了7例~22歲的女青年患陰道腺癌。這本是一種罕見的女性生殖系統(tǒng)癌癥,發(fā)病年齡一般在50歲以上。現(xiàn)在這種明顯的時(shí)間和地區(qū)的聚集性以及大為提早的發(fā)病年齡,引起了Herbst醫(yī)生探究其病因的興趣。
初步調(diào)查結(jié)果發(fā)現(xiàn)這7例均無使用陰道局部刺激物的歷史,除1例于發(fā)病后結(jié)婚外均否認(rèn)有性交史。為詳細(xì)了解這些病例從胚胎期至發(fā)病前的情況以及她們的母親在妊娠期的情況,從而尋找病因線索,Herbst決定作一次病例對(duì)照研究。
另外,同時(shí)期在另一所醫(yī)院也診斷了一例20歲的陰道腺癌病人。這樣,共有8個(gè)病例。每例匹配4個(gè)對(duì)照。從病例出生的醫(yī)院保存的出生記錄中選擇與病例在同等級(jí)病房中前后不超過5天出生的女嬰作為對(duì)照候選人,優(yōu)先選擇與病例出生時(shí)間最近者為對(duì)照。由經(jīng)過訓(xùn)練的調(diào)查員用調(diào)查表對(duì)病例、對(duì)照以及他們的母親進(jìn)行訪問調(diào)查。
在列入比較的許多因素中,多數(shù)在兩組間無顯著差別。例如,出生時(shí)母親的年齡、母親吸煙史、哺乳史及X線照射史等。但有3個(gè)因素顯示顯著差別:母親以前流產(chǎn)史,此次懷孕時(shí)陰道出血史,此次妊娠期曾用過已烯雌粉(DES)。三者的關(guān)系是:因有前兩個(gè)因素存在才用DES治療。尤以DES服用史差別最為明顯(x2=23.22,p<0.00001)。
通過8個(gè)病例與32個(gè)對(duì)照的病例對(duì)照研究,Herbst等得出結(jié)論,母親在妊娠早期服用DES可使其在子宮內(nèi)受暴露的女兒以后發(fā)生陰道腺癌的危險(xiǎn)性增加。
實(shí)際上,在妊娠期用過DES的婦女很多,但她們的女兒發(fā)生陰道腺癌的危險(xiǎn)并不高。病例對(duì)照研究結(jié)果提供的不是暴露招致的絕對(duì)危險(xiǎn)度(發(fā)病率)而只是相對(duì)危險(xiǎn)度。
從方法選擇上,DES與陰道腺癌的聯(lián)系問題,還可用歷史性隊(duì)列方法研究:收集在病例診斷前15~25年間曾在妊娠期用過DES的婦女的住院病歷,再選擇合適的、未用過DES的婦女的病歷作為對(duì)照組。對(duì)兩組婦女的女兒們進(jìn)行隨訪,確定陰道腺癌的發(fā)生率是否有差別。因?yàn)檫@是一種罕見病,這樣研究雖然理論上可行,但實(shí)際做起來困難很多。至于用前瞻性隊(duì)列法研究罕見病的病因,雖然理論上也可行,但實(shí)際上做不到。因此,可以看出:病例對(duì)照法是研究罕見病的最經(jīng)濟(jì)最快捷的途徑,常常是唯一實(shí)際可行的途徑。Herbst等只用8個(gè)病例與32個(gè)對(duì)照所完成的病例對(duì)照研究就是一個(gè)有意義的例子。
參看
流行病學(xué)分析性研究 | 流行病隊(duì)列研究 |
關(guān)于“流行病學(xué)/病例對(duì)照研究”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |