Het LUMC is een van de academische ziekenhuizen in Nederland, waar DNA-onderzoek plaatsvindt. Daarbij brengen onderzoekers de complete DNA-sequenties van een individu in kaart. ‘Dat zijn ongeveer drie miljard combinaties van de letters A, C, G en T, de vier bouwstenen van het DNA’, zegt Kai Ye, Assistant Professor Medische Statistiek & Bio-info bij de afdeling Moleculaire Epidemiologie van het LUMC. Hij is samen met projectleider Rob Cornelisse van de IT-afdeling van het ziekenhuis nauw betrokken geweest bij de ontwikkeling van een nieuwe storageomgeving.
Capaciteit
Bij het wetenschappelijke DNA-onderzoek komt een grote hoeveelheid data vrij. Ye: ‘Per individu gaat het al om één terabyte (TB) aan gegevens. Er lopen nu verschillende onderzoeken waarin we de gegevens van honderden mensen verzamelen. Om al deze gegevens te verwerken, is naast voldoende opslagcapaciteit een hoge I/O nodig om data snel te verwerken. De onderzoeken hebben op dit moment vooral een wetenschappelijk karakter, maar zijn ook van invloed op de patiëntenzorg. Het uiteindelijke doel is deze kennis in te zetten voor het opsporen en behandelen van ziektes. Bij DNA-onderzoek kijken we naar de sequenties van proefpersonen en controleren die op onregelmatigheden die bijvoorbeeld verband houden met kanker.’
Uitbreiding
Omdat de onderzoeksgroep bij het LUMC met de bestaande storageomgeving tegen de grenzen van de capaciteit aanliep, startte zij in samenwerking met Bull een oriëntatie op een nieuw systeem. De groep koos voor een eigen systeem dat uitsluitend bestemd is voor researchdoeleinden. Cornelisse: ‘We hebben na een uitgebreid en complex selectieproces gekozen voor de systemen van Isilon, die nu onderdeel is van EMC. Capaciteit en prestaties waren uiteraard belangrijke eisen, maar ook flexibiliteit en beheer speelden een rol bij de selectie. Zo biedt Isilon bijvoorbeeld de mogelijkheid om bestandssystemen van één petabyte te creëren.’
Implementatie
Voor installatie en implementatie van de oplossing schakelde het LUMC Bull in. Bull is na het winnen van een Europese aanbesteding de vaste partner van het ziekenhuis op het gebied van storage. Bull installeerde samen met de IT-afdeling van het LUMC een Isilon Cluster dat is opgebouwd uit vier 72NL Series-nodes. Deze configuratie voorziet in bijna 200 TB aan netto-opslagcapaciteit. Daarnaast maakt het LUMC voor snapshotbeheer gebruik van SnapshotIQ-software en voor load-balancing en failover-ondersteuning van SmartConnect-software. Het systeembeheer vindt plaats met behulp van Isilon OneFS, de eigen beheersoftware van Isilon.
Eisen en wensen
Het belangrijkste voordeel van de nieuwe omgeving is, dat de onderzoeksafdeling nu beschikt over een volledig eigen storageomgeving die is afgestemd op de eisen en wensen van het DNA-onderzoek. Dr. Ye: ‘We beschikken over een opslagplatform voor grote volumes data met voldoende snelheid om analyses uit te voeren. Ook is het systeem qua uitbreiding voldoende flexibel. We zien nu al dat we in 2012 waarschijnlijk weer meer capaciteit nodig zullen hebben. Dat is dan in principe snel uit te voeren.’
Auteur: Klaas Doornbos – Lammers van Toorenburg Benelux PR BV
Per individu gaat het al om één terabyte (TB) aan gegevens. Er lopen nu verschillende onderzoeken waarin we de gegevens van honderden mensen verzamelen.
Dan lijkt een uiteindelijke capaciteit van 200TB nog steeds niet zo veel. Een petabyte is 1000TB, dus na 1000 DNA-sequences moet er een nieuw filesystem komen? Lijkt nog steeds niet echt schaalbaar voor de midden-lange termijn.
Daarnaast wel benieuwd hoe dit zich verhoudt tot het kostenplaatje…