De wetenschap achter de conceptiecup

Als je vrouw en rond de 30 bent, weten bepaalde advertenties je te vinden. Ik was gedachteloos op Facebook aan het scrollen tot ik plots een reclame voor een product tegen kwam, de Ferti-lily. Een product dat de kans op een zwangerschap zou verhogen. Ik bekeek het een beetje en met mijn kennis van biologie had ik zo mijn bedenkingen over de effectiviteit. Op de website staat echter met grote letters dat het ‘klinisch bewezen’ is, inclusief een link naar hun wetenschappelijke artikel, dus ik besloot deze door te spitten. Conclusie: het bewijs is flinterdun. In deze blog leg ik je stap voor stap uit waarom dit zo is.

Wat is de Ferti-lily?

Allereerst wat uitleg over het product. De Ferti-lily is een cup die je na sexy time inbrengt. Het idee is een beetje dat je het zaad op zijn plek houdt in de baarmoederhals, waardoor zaadcelletjes meer kans hebben om zich een weg naar het eicelletje te zwemmen, om daarmee de kans op een succesvolle conceptie te verhogen.

Klinkt logisch toch? Niet helemaal. Uit eerder onderzoek is al gebleken dat 15 minuten netjes stil blijven liggen na de romantische daad niet je kansen verhoogt op zwangerschap vergeleken met direct opstaan en weer bewegen [1]. In dit onderzoek werden 498 koppels gerandomiseerd in twee groepen: de ene groep bleef stil liggen, de andere groep mocht na de inseminatie weer rondlopen. (Dat ze gerandomiseerd zijn is een belangrijk detail en kom ik later nog op terug.)

Meteen een inimini kanttekening: dit zijn stellen die IUI kregen, intra-uteriene inseminatie, dus geen stellen die het via de ‘ouderwetse’ weg deden. Maar in principe zie ik niet echt waarom dit heel veel anders zou zijn in koppels die gemeenschap hebben. Heel plat gezegd: er wordt bij beiden sperma in de baarmoeder gebracht. Sterker nog: je zou verwachten dat dit meer effect zou hebben bij IUI-koppels omdat die meer problemen met conceptie hebben.

'Klinisch' bewezen

Maar goed, de website beweert dat het effect van de cup ‘klinisch bewezen’ is. (Wat al niet helemaal klopt, want ‘klinisch’ toont aan dat je het in een klinische populatie hebt getest, dus onder patiënten, wat hier niet is gedaan. Maar goed, klein detail.) Laten we het wetenschappelijk paper erbij pakken wat op hun website te vinden is en stap voor stap bekijken wat er precies gedaan is in dit onderzoek [2].

Study design

In het paper kunnen we het volgende vinden over hoe het onderzoek is opgezet: “The trial was designed as a prospective, 1-arm, open label, nonrandomized, observational study.” Wat houdt dit in?

  • Prospective: prospectief, we kijken dus vooruit in de tijd.
  • 1-arm: er is maar één arm of groep, we vergelijken dus niet twee groepen met elkaar.
  • Open label: mensen zijn niet ‘geblindeerd’, mensen weten dus dat ze de cup gebruiken.
  • Non-randomized: mensen zijn niet gerandomiseerd tot een bepaalde groep (kan ook niet, want je hebt maar één groep).
  • Observational: er is geen interventie verder, we bestuderen mensen die het product gebruiken.

Het is dus zo dat iedereen die meedeed de cup gebruikte. Er is dus geen controlegroep waarmee we het kunnen vergelijken. En hier is eigenlijk al de eerste kanttekening, want je vergelijkt het niet met een groep mensen die de cup NIET gebruikt. (De onderzoekers vergelijken het met een soort verwachte kans, daarover later meer.)

De tweede kanttekening is dat mensen niet gerandomiseerd zijn. Je hebt bij mensen heel veel achtergrondfactoren die de uitkomst kunnen beïnvloeden. Als je willekeurig mensen toewijst aan groepen voorkom je dit. Je hebt dan bijvoorbeeld niet dat heel erg gemotiveerde mensen de cup gebruiken en mensen die minder gemotiveerd zijn niet, waardoor dit weer invloed heeft. Je kijkt dus eerlijker naar de effecten. (Maar goed, zoals ik al zei: randomisatie kan dus ook niet in dit onderzoek, maar is een belangrijk punt. Kom ik later op terug.)

Populatie

Bij wie hebben ze onderzoek gedaan? In het paper lezen we het volgende: “The study population was derived from women that spontaneously purchased the FCC device.” Ze hebben dus enkel mensen onderzocht die het product hebben gekocht. En hier is weer een kanttekening bij te plaatsen. Dit is namelijk niet een representatieve groep. Dit zijn mensen die waan-zin-nig gemotiveerd zijn om zwanger te worden, ze hebben immers speciaal zo’n cup gekocht. Dit zijn niet simpelweg mensen met een kinderwens die gaan ‘proberen’. Je zou je dus kunnen voorstellen dat deze mensen extra hun best doen om zwanger te worden en daarmee de uitkomsten van dit onderzoek vertekenen.

De onderzoekers hebben 1384 mensen benaderd, waarvan uiteindelijk 85 mensen hebben meegedaan. Ik heb het even uitgerekend voor je, dat komt neer op 6%. Dat is echt een ontzettend laag getal. Dit zijn namelijk mensen die het product al hebben gekocht en ermee aan de slag willen. Het extra werk is een paar vragenlijsten. Waarom wil de rest niet meedoen? Waren dat mensen bij wie het niet lukte? Of die toch niet zo gemotiveerd zijn? Dat zou namelijk je uitkomst ontzettend kunnen vertekenen.

Effect size

Eerst even een korte uitleg wat ‘effect size’ is. Effect size betekent de grootte van het effect. Hoe groter het effect is dat je verwacht (in dit geval van de cup), hoe minder mensen je nodig zult hebben om het effect aan te tonen.

Effect size is een belangrijk element in van te voren bepalen hoeveel mensen je zult nodig hebben en wordt dus gebruikt in de zogeheten sample size analysis. Apart is dan ook dat ze niet noemen welke effectgrootte ze van te voren verwachten (ze noemen overigens wel de andere ‘ingrediënten’ van de berekening). Wel zeggen ze dat de effect size gebaseerd is op twee andere papers. Ik heb even de papers erop nageslagen. De ene paper is een artikel over baarmoederslijmvlies monitoring en de ander gaat over ovulatietesten. Het zijn dus niet eerdere artikelen over cups waarmee dit te vergelijken is. (Overigens gaan ze uit van een vrij forse effect size, wat ik niet helemaal zou verwachten met zo’n cup, maar daarover zou je kunnen discussiëren. Feit blijft dat je wel de effect size moet noemen en ook goed moeten kunnen onderbouwen.)

Oftewel: ze gebruiken een bepaalde effect size (hoe groot is niet duidelijk) die ze herleiden uit heel ander onderzoek wat er niet op lijkt. Het is een beetje als zeggen dat je verwacht een 8 te halen voor Frans omdat je laatst wel een lekkere appeltaart hebt gebakken.

(Eventjes ter vergelijking met de eerdere studie ik aanhaalde, die ene waar mensen 15 minuten moesten blijven liggen. Ik vind dat een logische studie om je effect size op te baseren, omdat het idee ongeveer hetzelfde is, namelijk zaad langer in de baarmoederhals houden. Dat onderzoek onderzocht bijna 500 koppels!)

Ovulatietest

De volgende zin viel me op: “At time of study initiation, each participant received a test package for the duration of 1 menstrual cycle using the FCC, consisting of a non-digital ovulation and a non-digital pregnancy test to track their fertile days and determine positive or negative pregnancy outcome, respectively.”

Er staat dus dat de deelnemers naast de cup en een zwangerschapstest ook nog eens een ovulatietest ontvingen. Oftewel: een test waarmee je kan zien wanneer precies je vruchtbare dagen zijn. Je hebt een kans dat mensen voorafgaande aan het gebruik van deze cup helemaal niet zo’n test gebruikten. Door zo’n test te gebruiken, verhoog je aanzienlijk je kansen om zwanger te worden. Dus de effecten die de cup laat zien, zouden deels toe te schrijven kunnen zijn aan het gebruik van de ovulatietest. (Hoeveel precies? Tsja, daar kom je niet achter met hoe dit onderzoek is opgezet.)

Controlegroep

Je hebt elke cyclus een bepaalde kans om zwanger te worden en die is afhankelijk van verschillende zaken. Denk aan leeftijd, kwaliteit van sperma, hoe vaak je seks hebt, noem maar op. De gemiddelde kans per cyclus wordt geschat op 15-20%. Niet een wetenschappelijke bron, maar ik vond op 24Baby de kansen voor zwanger worden binnen 3 maanden, 6 maanden, 1 jaar en 2 jaar. Binnen 3 maanden (de duur van dit onderzoek) heb je een kans van 30% om zwanger te worden. Je zou dan kunnen zeggen: “Dit onderzoek laat een kans van 35.4% zien, dus dat is dan toch hetzelfde of zelfs ietsje hoger?” Kan, maar dat is beetje met de botte bijl. Dit onderzoek heeft verschillende berekeningen gedaan per persoon en die kwam uit op een gemiddelde kans van 23.9%. Iets lager dus dan 30%, wat mogelijk verklaard kan worden doordat veel mensen zo’n cup pas kopen na heel lang proberen, iets dat invloed heeft op die berekening.
Oftewel: het effect is zelfs nóg beter, 48% beter, het cijfer wat ook groots op de website wordt genoemd.

Je zou kunnen denken: “Mooi toch? Dan fungeren mensen als hun eigen controle?” Zou zeker kunnen. Ik ben er echter geen fan van. De berekening is vrij grof, het neemt enkel de leeftijd van de vrouw en hoe lang je aan het proberen bent in de berekening. Terwijl er toch echt meer zaken van belang zijn. Denk bijvoorbeeld aan hoe vaak je seks hebt. Je kan je voorstellen dat als je meedoet aan zo’n onderzoek, dat je dan extra je best doet en een keertje vaker sexy time hebt. Dat neemt het model niet mee, terwijl het wel heel veel invloed heeft op je kans om zwanger te worden. En wat dacht je van timing van seks hebben? Dat wordt toch aanzienlijk beïnvloed door zo’n ovulatietest die je bij het onderzoek krijgt.

Statistiek

Ze hebben de volgende statistiek gebruikt in het onderzoek: “The proportion of pregnant women was calculated using the following formula: (100*Number of women becoming pregnant)/Number of women in the population. Exact 95% confidence intervals (Clopper-Pearson) of the proportion of women becoming pregnant for the various (sub)populations in the study population were calculated.”

Wat ze dus hebben gedaan is berekend hoeveel vrouwen er zwanger zijn geworden en daar een betrouwbaarheidsinterval bij berekend. Verder is me niet duidelijk wat ze nu precies gedaan hebben. Ze vergelijken het in elk geval met de verwachte kans. Kijken ze dan enkel naar overlappende intervallen met de controlegroep? Of hebben ze ook bijvoorbeeld een statistische test gedaan? Maar dat lijkt niet het geval te zijn. Hoe komen ze dan aan hun P-waardes?

Geen limitaties

Wat ik heel bijzonder vind is dat er in dit onderzoek géén limitaties worden genoemd. Nada. Iets wat toch echt heel erg gebruikelijk is bij wetenschappelijk onderzoek. In vrijwel elk paper, hoe goed het ook is uitgevoerd, zul je zien dat wetenschappers kritisch zijn over hun eigen onderzoek.

Belangen

De onderzoekers zijn transparant over het feit dat de hoofdonderzoeker eigenaar is van het product en aandeelhouder van het bedrijf dat er achter zit. Ook is het onderzoek gefinancierd door het bedrijf. Ze noemen dat het onderzoek onafhankelijk ontworpen en uitgevoerd is door een ander bedrijf.

Belangen komen voor in wetenschappelijk onderzoek. Dat er belangen zijn is op zich niet erg, je moet er wel transparant over zijn en dat hebben de onderzoekers ook netjes gedaan.

Hoe zou het wél aangetoond kunnen worden?

Let op: ik zeg niet dat het product niet werkt. Ik zeg alleen dat het op basis van dit onderzoek niet kan worden geconcludeerd dat het werkt. Er zitten te veel haken en ogen aan die de uitkomsten beïnvloeden. Maar wat is dan een manier om wél de werkzaamheid aan te tonen? Ik doe alvast een voorzetje.

De werkzaamheid van een product kan je aantonen door een zogeheten RCT: een randomized clinical trial. Je hebt dan twee groepen mensen die je met elkaar vergelijkt. Deze mensen wijs je willekeurig toe aan twee groepen. De ene groep geef je de cup en de andere groep geef je geen cup. Op deze manier weten mensen of ze wel of niet een cup gebruiken, het is dus zogezegd niet ‘geblindeerd’, maar voor dit onderzoek is dat niet erg. Het is niet zo dat je sneller zwanger wordt doordat je weet dat je de cup gebruikt. (Edit: iemand wees me erop dat mensen mogelijk meer ontspannen zouden kunnen zijn doordat ze weten dat ze de cup gebruiken en daardoor een hogere kans zouden kunnen hebben op een zwangerschap. Misschien. Ik verwacht zelf dat dit vrij weinig effect heeft, maar daar valt over te discussiëren. Als we dan terugdenken aan dat eerdere onderzoek – die ene met 15 minuten blijven liggen – dan zou je ook mogelijk daar dat effect verwachten.)
Let op dat in zo’n RCT het gebruik van de cup het enige verschil is. Je gaat dus niet de ene groep nog een ovulatietest aanbieden en de andere niet.

Over de hoeveelheid mensen. Ik heb even een berekening gedaan met het programma GPower: met een α van 0.05, een β van 0.80 (wat ook wordt aangehouden in het paper) en een voorzichtige effect size van 0.2 kom ik uit op 197. Dus ik zou minstens 200 mensen hiervoor bestuderen (hier is uitval nog niet bij berekend) en wellicht dat dit nog veel groter kan uitvallen (denk maar aan het eerdere onderzoek dat 498 koppels onderzocht).

Vervolgens volg je deze mensen een bepaalde periode, een jaar bijvoorbeeld? En dan check je in beide groepen of mensen zwanger zijn geworden. Dit doe je overigens via een gevalideerde wijze, je laat mensen een zwangerschapstest doen die positief moet zijn. Vervolgens check je of er een verschil is tussen de twee groepen. Dit doet je met statistische analyses, je zou hier kunnen kiezen voor een vrij simpele Fisher’s Exact Test of Chi-kwadraat. Je zou ook survival analyses kunnen doen, daarmee kun je berekeningen doen hoe lang het duurt voordat je zwanger bent.

Ook zou het interessant kunnen zijn om bepaalde karakteristieken van de vrouwen te verzamelen, zodat je onderzoek kan doen naar bijvoorbeeld de effecten van leeftijd, frequentie van seks, etc. Dan zou je zelfs nog een soort model kunnen maken dat voorspelt bij welke mensen het beter werkt.

Conclusie

De website geeft aan dat het product ‘klinisch bewezen’ is. Door een wetenschappelijke publicatie op de website te plaatsen lijkt het al heel snel gewichtig en hebben mensen vertrouwen in je product. Echter, als je goed in het onderzoek duikt, blijkt al heel snel dat het onderzoek niet goed is uitgevoerd en dat je op basis van een dergelijk onderzoek niet zo’n claim kan maken.

Referenties

  1. Van Rijswijk, J., Caanen, M.R., Mijatovic, V. Vergouw, C.G., Van de Ven, P.M., Lambalk, C.B., Schats, R. (2017). Immobilization or mobilization after IUI: an RCT. Human Reproduction. 32;11:2218-2224.
  2. Van den Dool, G., Van Osta, G., Wiegerinck, M. The FERTI·LILY conception cup increases the chance of conceiving in comparison with expected pregnancy rates: a prospective observational study. (2021). Journal of Pregnancy and Newborncare. 4;1:2-11.
Default image
Babette
Articles: 13