Simpsons paradox

Simpson's paradox is een paradox uit de statistiek. Hij is genoemd naar Edward H. Simpson, een Britse statisticus die hem voor het eerst beschreef in 1951. De statisticus Karl Pearson beschreef een zeer vergelijkbaar effect in 1899.- De beschrijving van Udny Yule dateert van 1903. Soms wordt het het Yule-Simpson effect genoemd. Wanneer men de statistische scores van groepen bekijkt, kunnen deze scores veranderen naargelang men de groepen één voor één bekijkt, dan wel ze samenvoegt tot een grotere groep. Dit geval doet zich vaak voor in de sociale wetenschappen en de medische statistiek. Het kan mensen in verwarring brengen, als frequentiegegevens worden gebruikt om een oorzakelijk verband te verklaren. Andere namen voor deze paradox zijn omkeerparadox en samensmeltingsparadox.

Voorbeeld: Behandeling van nierstenen

Dit is een voorbeeld uit de praktijk van een medisch onderzoek waarin de succespercentages van twee behandelingen van nierstenen werden vergeleken.

De tabel toont de succespercentages en het aantal behandelingen voor behandelingen van zowel kleine als grote nierstenen, waarbij behandeling A alle open procedures omvat en behandeling B percutane nefrolithotomie is:

Behandeling A

Behandeling B

succes

storing

succes

storing

Kleine Stenen

Groep 1

Groep 2

aantal patiënten

81

6

234

36

93%

7%

87%

13%

Grote Stenen

Groep 3

Groep 4

aantal patiënten

192

71

55

25

73%

27%

69%

31%

Zowel

Groep 1+3

Groep 2+4

aantal patiënten

273

77

289

61

78%

22%

83%

17%

De paradoxale conclusie is dat behandeling A doeltreffender is wanneer zij wordt toegepast op kleine stenen, en ook wanneer zij wordt toegepast op grote stenen, maar dat behandeling B doeltreffender is wanneer beide grootten tegelijk in aanmerking worden genomen. In dit voorbeeld was het niet bekend dat de grootte van de niersteen van invloed was op het resultaat. Dit wordt in de statistiek een verborgen variabele (of lurking variable) genoemd.

Welke behandeling als beter wordt beschouwd, wordt bepaald door een ongelijkheid tussen twee verhoudingen (successen/totaal). De omkering van de ongelijkheid tussen de verhoudingen, die de paradox van Simpson doet ontstaan, gebeurt doordat twee effecten samen optreden:

  1. De grootte van de groepen, die worden gecombineerd wanneer de loerende variabele wordt genegeerd, is zeer verschillend. Artsen zijn geneigd de ernstige gevallen (grote stenen) beter te behandelen (A), en de mildere gevallen (kleine stenen) minder goed (B). Daarom worden de totalen gedomineerd door de groepen drie en twee, en niet door de twee veel kleinere groepen een en vier.
  2. De loerende variabele heeft een groot effect op de ratio's, d.w.z. dat het succespercentage sterker wordt beïnvloed door de ernst van het geval dan door de keuze van de behandeling. Daarom doet de groep patiënten met grote stenen die behandeling A gebruiken (groep drie) het slechter dan de groep met kleine stenen, ook al gebruiken deze laatsten de inferieure behandeling B (groep twee).

AlegsaOnline.com - 2020 / 2023 - License CC3