Correlatie
Laten we eerst beginnen met wat correlatie eigenlijk is. Correlatie is officieel de samenhang tussen twee variabelen. Eigenlijk bedoelen we in deze context gewoon ‘verband’ hiermee. In deze blog neem ik hiervoor graag het voorbeeld dat ik heb geleerd tijdens mijn opleiding tot klinisch epidemioloog: het hebben van een aansteker in je zak en de kans op longkanker. Je kunt al een beetje aanvoelen dat hier een verband is. De aansteker zelf veroorzaakt natuurlijk niet longkanker, maar wel roken. En als je rookt, is de kans dat je een aansteker in je zak hebt natuurlijk hoger… Dit is een voorbeeld van correlatie en niet causaliteit: er is een verband, maar het ene veroorzaakt het andere niet.
Zo is er bijvoorbeeld ook een verband tussen roken en een psychiatrische stoornis hebben. Roken veroorzaakt natuurlijk niet een psychiatrische stoornis, maar mensen met een dergelijke diagnose roken wel vaker dan mensen die dit niet hebben.
Klein zijpaadje: als je erop gaat zoeken, zal je hele rare correlaties vinden, zoals hier en hier. Er zijn verbanden tussen ijsconsumptie en moorden, tussen de hoeveelheid piraten en de temperatuur op aarde, tussen de hoeveelheid films met Nicholas Cage en mensen die verdrinken in hun eigen zwembad… Ik hoef je hier hopelijk niet te zeggen dat dit misschien verbanden zijn, maar geen oorzakelijke verbanden. Dit soort verbanden zijn ook wel spurious correlations: correlaties gebaseerd op toeval.
Causaliteit
Causaliteit is ook een verband tussen twee variabelen, maar het is ook nog eens een oorzakelijk verband. Dit is bijvoorbeeld het verband tussen roken en longkanker. Hier zie je niet alleen correlatie, maar ook nog eens causaliteit. Er is niet alleen een verband tussen roken en longkanker (dat iemand rookt, verhoogt de kans op longkanker), maar het is ook nog eens causaal (roken veroorzaakt daadwerkelijk longkanker).
Wanneer is iets causaal?
Maar hoe kun je nu zien of iets slechts een verband is of dat het ook echt causaal is? Er zijn een aantal voorwaarden voor causaliteit, ook wel de zogeheten Bradford-Hill criteria [1]. Wanneer je deze criteria naast een bepaald verband legt en het tikt alle boxen aan, dan is het heel waarschijnlijk dat je naar een causaal verband zit te kijken.
- Grootte van het effect. Hoe groter het effect, hoe groter de kans dat er ook echt een causaal effect is. (Hoewel een kleiner effect natuurlijk niet meteen betekent dat het niet causaal kan zijn.)
- Consistentie (of reproduceerbaarheid). Wanneer het effect wordt gevonden door verschillende groepen in verschillende settings in verschillende landen, dan is de kans hoger dat het ook echt een causaal effect is. Dus stel dat William uit de Verenigde Staten, Eleonara uit Italië en Nam uit Thailand in hun onderzoeken allemaal vinden dat roken longkanker veroorzaakt, dan is de kans groter dat het effect er echt is. Stel dat Pernille uit Denemarken onderzoek heeft gedaan onder zwangere vrouwen, Kate uit Zuid-Afrika onder ouderen en Kim uit Zuid-Korea onder mensen met een schildklieraandoening en ze vinden allemaal hetzelfde effect, dan is de kans ook hier weer groter dat het een causaal verband betreft. Zelfde als het gevonden wordt in een case-control study, een trial en een prospectief cohort.
- Specificiteit. Hoe specifieker het verband tussen een oorzaak en een gevolg is, hoe groter de kans op een oorzakelijk verband.
- Tijd. De oorzaak gaat vooraf aan het gevolg. Roken kan longkanker niet veroorzaken als het niet er aan vooraf gaat. Als je longkanker hebt en je gaat daarna pas roken, dan kan roken dus niet longkanker veroorzaakt hebben. (Dit is ook het probleem met dwarsdoorsnede onderzoeken: je kijkt naar één moment in de tijd naar zowel oorzaak als gevolg. Je kunt dus in dit type onderzoek niet weten wat eerder was en daardoor geen goede uitspraken doen over causaliteit.)
- Biologische gradiënt (of dosis-responsrelatie). Heel specifiek voor dit voorbeeld: hoe meer je rookt, hoe hoger je kans op longkanker.
- Plausibiliteit. Als er een logisch mechanisme achter zit, dan is de kans op causaliteit groter. (Het lastige hieraan is dat je niet altijd alle kennis hebt over een bepaald mechanisme, dus dan zou je dit criterium niet kunnen afvinken.)
- Coherentie. Als er een samenhang is tussen bijvoorbeeld experimenten in laboratoria en observaties in de populatie, dan vergroot dat de kans op causaliteit. Denk hierbij bijvoorbeeld aan dat longkanker niet alleen wordt gevonden in mensen die roken, maar ook bijvoorbeeld in muizen die in een laboratorium worden blootgesteld aan rook. (Het probleem bij dit criterium is dat dit niet altijd mogelijk is. Denk bijvoorbeeld aan – ik noem maar iets – knutselen. Misschien dat knutselen hartstikke goed werkt tegen gameverslaving. Hoe ga je dit in petrischaaltjes of in muizen testen?)
- Experiment. Soms zou je dingen die je observeert kunnen bevestigen in een experiment. In dit voorbeeld zou je bijvoorbeeld groepen mensen kunnen blootstellen aan sigarettenrook. De ene groep krijgt een dosis van 500, de ander van 1000, en de ander van 2000. Wie krijg er eerder longkanker? (In dit voorbeeld zie je al dat een experiment niet mogelijk is, simpelweg omdat het niet ethisch is.)
- Analogie. Soms zijn er overeenkomsten tussen het verband en andere verbanden, die de causaliteit onderstrepen. Denk hierbij bijvoorbeeld aan roken en de kans op andere soorten kanker.
- Reversibiliteit. Als je de oorzaak weghaalt, zou het effect ook moeten verdwijnen. In ons voorbeeld zou dit mogelijk zijn, maar het kan ook zo zijn dat iemand na 20 jaar roken stopt en 10 jaar later tóch longkanker krijgt. (Overigens is dit criterium later toegevoegd en niet altijd van toepassing.)
Het voorbeeld van roken en longkanker is natuurlijk een vrij makkelijk voorbeeld om het verschil tussen correlatie en causaliteit goed uit te leggen. Maar hoe zit dat nu met zaken die misschien wat minder makkelijk voor de hand liggen?
Ik ben een tijdje geleden in een discussie op Instagram terecht gekomen over hoe goed vitamine D zou zijn tegen depressieve klachten. Ik denk dat deze discussie een heel mooi en klassiek voorbeeld is hoe correlatie en causaliteit verward kunnen worden, dus ik haal hem hier nog eens graag aan.
Vitamine D en depressie: causaal of gecorreleerd?
Iemand op Instagram plaatste een post over dat zij zich een beetje meh voelde in de winter en vroeg om tips aan haar volgers. Nou, heel toevallig heb ik een promotieonderzoek gedaan over lichttherapie, dus ik had zeker wat tips voor haar. Ik bekeek uit nieuwsgierigheid wat andere mensen hadden geplaatst onder haar post en zag dat veel mensen de tip voor haar hadden om vitamine D te slikken, want dat zou helpen tegen depressieve klachten. Lang verhaal kort: it doesn’t.
(Overigens ben ik voor het slikken van vitamine D in de winter, maar om hele andere redenen.)
Ja, er zijn onderzoeken die een verband laten zien tussen een gebrek aan vitamine D en depressieve klachten (zoals deze [2]). Dus: mensen die lagere spiegels van vitamine D hebben, hebben vaker last van depressieve klachten. Het is dan verleidelijk om te denken dat een tekort aan vitamine D depressie veroorzaakt. Maar: ondanks dat er een verband is tussen de twee, de lagere spiegels hoeven niet per se de depressieve gevoelens ook te veroorzaken. Er is dus wel een verband, maar niet per se een oorzakelijk verband. En omdat te weinig vitamine D niet per se depressie veroorzaakt, is vitamine D nemen ook niet de oplossing voor het fixen van depressie (of somberheid, of beetje moody gevoel, meh zijn, of welke term dan ook). Je ziet dan ook in verschillende studies dat het suppleren van vitamine D hier niet tegen helpt (zoals hier [3]). Studies die wél een effect laten zien, hebben vaker een hogere risk of bias en moet je dus uiterst kritisch lezen (zoals hier [4]).
Het verband zou echter anders kunnen liggen. Het zou in dit voorbeeld zelfs andersom kunnen zijn, dat depressie een tekort aan vitamine D bijvoorbeeld veroorzaakt. Huh? Hoe zit dat dan weer?
Mensen met een depressie hebben veel last van sombere gevoelens, hebben vaker last van minder energie en meer vermoeidheid en hebben vaker minder interesse en plezier in zaken. (Kleine side note: depressie ziet er niet bij iedereen hetzelfde uit, dus sommige mensen hebben hier misschien geen last van.) Mensen met depressie zorgen vaak minder goed voor zichzelf en gaan bijvoorbeeld ook minder vaak naar buiten, waardoor ze minder blootstelling aan zonlicht hebben. Daardoor maken ze zelf minder vitamine D aan. Ook eten ze vaker minder gezond en krijgen daarmee minder vitamine D binnen. Dus: depressie kan zorgen voor een vitamine D tekort.
Overigens probeerde ik dit hele verhaal heel genuanceerd uit te leggen op Instagram, maar dat werd toch niet helemaal gewaardeerd.
Conclusie
Wees je dus bewust van het feit dat het ene het ander niet altijd hoeft te veroorzaken, wanneer je een verband ziet tussen twee zaken. Een correlatie geeft een verband aan, maar niet altijd een oorzaak en een gevolg. Soms liggen de dingen net even anders en soms net op een manier die jij niet altijd helemaal kan overzien, simpelweg omdat je niet alle kennis over het onderwerp hebt.
- Bradford Hill, A. The Environment and Disease: Association or Causation? Proceedings of the Royal Society of Medicine. 1965;58:295-300.
- Anglin R.E.S., Samaan Z., Walter S.D., McDonald S.D. Vitamin D deficiency and depression in adults: systematic review and meta-analysis. The British Journal of Psychiatry. 2013;202:100-107.
- Gowda U., Mutowo M.P., Smith B.J., Wluka A.E., Renzaho A.M.N. Vitamin D supplementation to reduce depression in adults: meta-analysis of randomized controlled trials. Nutrition. 2015;31(3):421-429.
- Shaffer J.A., Edmondson D., Wasson L.T., Falzon L., Homma K., Eokoli N., Li P., Davidson K.W. Vitamin D suppletion for depressive symptoms: a systematic review and meta-analysis of randomized controlled trials. Psychosomatic Medicine. 2014;76(3):190-196.