Coronacrisis zorgt voor omslag: van data delen naar data raadplegen

Gegevens over de covid-19-uitbraak moeten van meet af aan bruikbaar voor machine learning worden opgeslagen. Vervolgens moeten ze snel wereldwijd te raadplegen zijn. Dat is de missie van het Virus Outbreak Data Network (VODAN) onder leiding van LUMC-hoogleraar Barend Mons. ‘We willen uiteindelijk naast een wereldwijd netwerk ook een FAIR datapoint in elk Nederlands ziekenhuis.’

Artikel bewaren

U heeft een account nodig om artikelen in uw profiel op te slaan

Login of Maak een account aan

‘Deze uitbraak betekent voor jullie een doorbraak.’ Dat zei een collega tegen LUMC-hoogleraar Barend Mons. Als wetenschappelijk directeur van samenwerkingsverband GO FAIR propageert hij al langer dat (medische) data internationaal toegankelijker moeten worden voor wetenschappelijk onderzoek. Dat ging tot nu toe vrij moeizaam, maar komt door de crisis in een stroomversnelling. Mons: ‘De crisis werkt als een snelkookpan: nu kan het opeens wel.’

Bruikbare data voor machine learning

Om het ontsluiten van data in de crisis – en bij volgende virusuitbraken – goed te organiseren, is het Virus Outbreak Data Network (VODAN) opgericht. Het uitgangspunt is om ervoor te zorgen dat data FAIR zijn: Findable (vindbaar), Accessible (toegankelijk), Interoperable (onderling vergelijkbaar) en Reusable (herbruikbaar). ‘Dat betekent dat de gegevens fully AI ready zijn’, legt Mons uit. ‘Oftewel: meteen bruikbaar voor machine learning. Als we dat vanaf dag één zo hadden ingericht, hadden we veel eerder een duidelijk plaatje van het ziektebeeld. Dan hadden we zeker levens kunnen sparen.’

Netwerk groeit als kool

‘Aan het begin van de covid-19-uitbraak zijn we begonnen razendsnel netwerken op te zetten’, blikt Mons terug. ‘We moeten hier met zijn allen de schouders onder zetten. We hebben de data ook nodig om de bestrijding van covid te rationaliseren.’ Het VODAN-netwerk groeit als kool, constateert Mons tot zijn genoegen. ‘VODAN werd zo overtekend dat we subclusters hebben gevormd.’

Het netwerk beperkt zich niet tot Europa, benadrukt hij. ‘Het strekt zich ook uit tot Afrika, Amerika, China, noemt maar op.’ Aan deelname worden maar twee voorwaarden gesteld. De beschikbaar gemaakte data moeten FAIR zijn en er mag geen sprake zijn van vendor lock-in. ‘We willen niet dat bedrijven of wetenschappelijke instellingen ze monopoliseren.’

Datastations

Cruciaal is dat de data de plek van herkomst niet hoeven te verlaten, benadrukt Mons. ‘We hebben gemerkt dat Afrikaanse landen aanvankelijk heel terughoudend waren. Bij de uitbraak van ebola zijn ze destijds al hun data kwijt geraakt. Daar kunnen ze nu zelf niet eens meer bij. Een schande natuurlijk. Zodra we uitlegden dat de data op hun plek blijven, draaiden ze vaak 180 graden.’ Het idee is dat de data te raadplegen zijn via zogeheten datastations. Algoritmes kunnen als treintjes heen en weer rijden en alleen de relevante informatie voor een bepaalde vraag inzien.

‘Je stuurt zo’n algoritme bijvoorbeeld op pad met de vraag hoeveel mensen een bepaald geneesmiddel hebben gekregen en hoe ze daarop reageerden. Die informatie wordt opgehaald op de verschillende stations en zo krijg je je antwoord. Zonder informatie over individuele patiënten te krijgen.’

Dat is niet alleen praktisch, maar ook bittere noodzaak volgens Mons. ‘Niemand gaat bijvoorbeeld zijn CT-scans naar de VS sturen. De Chinezen gaan hun data al helemaal niet op die manier delen. Voor je het weet roept Trump er van alles over.’

Einde aan data delen

Het voorgestelde systeem maakt in die zin een einde het delen van data. ‘We gaan van data sharing naar data visiting’, vat Mons samen. De infrastructuur die daarvoor nodig is – het netwerk met stations waar FAIR data in te zien zijn – wordt momenteel opgezet. Een aantal Duitse en Nederlandse ziekenhuizen hebben momenteel al een FAIR data point (zo’n station in de trein-vergelijking).

‘Dat is allemaal nog houtje-touwtje, maar daardoor weten we al wel dat het werkt’, stelt Mons. ‘TNO gaat dit nu opschalen, met steun van het ministerie van economische zaken en de AI Coalitie. Binnen VODAN is bovendien al een project gestart, dat steun krijgt van ZonMw en de Philips Foundation. Dat project levert een FAIR data model op voor covid-19. Daarnaast leidt het tot een FAIR data point dat makkelijk ter plaatse geïnstalleerd en gevuld kan worden. We willen uiteindelijk naast een wereldwijd netwerk ook een FAIR datapoint in elk Nederlands ziekenhuis.’

Laagdrempelig

Om dit te faciliteren, probeert VODAN het technisch zo eenvoudig mogelijk te maken. ‘Artsen hoeven er niks van te merken. De gegevens die zij invoeren, moeten er aan de achterkant automatisch FAIR uitkomen.’ Ook installatie van een data point moet laagdrempelig zijn, weet Mons. ‘Tot voor kort had je een super IT-er nodig om een data point op te zetten. In het VODAN project hebben we nu een data point in een box ontwikkeld, die eenvoudig te installeren is. Binnenkort openen we het eerste datapoint in China en in verschillende Afrikaanse landen. We hadden natuurlijk van meet af aan beschikking moeten hebben over de data in China, dan hadden we nu niet drie maanden achtergelopen.’

Betrouwbaarheid

Hoe zit het dan met de betrouwbaarheid van de data? Mons: ‘Je kunt natuurlijk totale fake data invoeren. Daarom is het belangrijk dat er ook machine readable metadata beschikbaar zijn: informatie over de herkomst van de gegevens. Bovendien ziet een algoritme heel snel afwijkingen. Ik denk allerlei fake publicaties uit het verleden eerder zouden zijn opgespoord door machine learning.’

De wetenschappelijke wereld moet volgens de hoogleraar sowieso een omslag in denken maken. ‘Niet eerst wachten tot je Nature-publicatie er is, maar meteen je data beschikbaar maken. Wat mij betreft kun je trouwens iedereen wiens data gebruikt zijn voor een onderzoek noemen als co-auteur.’

Effectieve medicijnen

Op basis van data en eerder opgedane kennis heeft Mons een model gemaakt om snel met bestaande kennis te rationaliseren welk medicijn in welke fase van de ziekte effectief lijkt te zijn. ‘Dat heb ik opgestuurd naar collega’s Van Dissel en Gommers en ter publicatie aangeboden aan BioRxive. Ik heb gekeken naar alle geneesmiddelen die getest worden en iets lijken te doen.’

Doorbraak in ziektebeeld

De uitkomst betekent volgens Mons een mogelijke doorbraak in het begrip van het dominante ziektebeeld in milde en zware gevallen. ‘We hebben het logisch in fases kunnen indelen. Als ons model klopt – en dat denken we natuurlijk – kunnen we met behulp van experts snel voor elk medicijn bepalen of er bestaande kennis is die de toepassing rechtvaardigt. En in welke fase van de ziekte het medicijn wellicht effectief is.’

‘Vroeg in het proces zijn dat bijvoorbeeld geneesmiddelen die de cytokine-storm kunnen voorkomen, zoals IL6-remmers’, vervolgt Mons. ‘Aan het eind van het proces kunnen middelen die thrombus-vorming voorkomen effectief zijn. Wij gaan nu systematisch symptomen mappen op het onderliggende data model. We kunnen dan – als zij dat willen – artsen ondersteunen bij het rationaliseren van therapie. Daarbij wordt natuurlijk eerst ingezet op repurposing van bestaande middelen en daarna ook gekeken naar nieuwe middelen.’

Pijnlijke conclusie

Als het model inderdaad werkt om levensbedreigende complicaties van een infectie effectiever te behandelen, is dat natuurlijk mooi. De tragiek is dat het model er veel eerder had kunnen zijn. ‘De data waren er al, maar er moest eerst over worden gepubliceerd’, weet Mons. ‘Ik heb het model nu deels handmatig gemaakt. Met Artificial Intelligence en bezoekbate data was het er bij wijze van spreken in tien minuten geweest. De gevolgen van het niet delen van data worden in deze pandemie pijnlijk duidelijk. Ik hoop dat we ervan leren.’

Er wordt al veel geschreven over het coronavirus, daarom schrijven wij alleen over zaken die belangrijk zijn voor u: de zorgprofessional. Al onze corona-gerelateerde artikelen zijn de komende tijd gratis beschikbaar zodat u in deze crisis geen informatie hoeft te missen. Schrijf u nu in voor de nieuwsbrief en lees dagelijks over de uitdagingen en oplossingen.

Geef uw reactie

Om te kunnen reageren moet u ingelogd zijn. Heeft u nog geen account, maak dan hieronder een account aan. Lees ook de spelregels.