Mangel på computerkraft kan bremse dna-forskning

9. maj 2008 kl. 00:45
Det tegner godt for fremtidens sygdoms­behandling, at det er blevet uhyre billigt og nemt at kortlægge vores genomer. Men forskerne glemmer at tænke på, hvordan de gigantiske mængder data skal gemmes
Artiklen er ældre end 30 dage

Informationer om vores dna sprøjter ud af sekvensmaskinerne i disse år - men desværre har vi snart ikke noget sted at gemme de store mængder data.

For biologernes computere har ikke hukommelse nok til at håndtere de mange terabytes - det vil sige tusindvis af gigabytes - af dna-information, der skal gemmes på computere, efterhånden som flere og flere mennesker får kortlagt deres arvemasse.

Det frygter en af Danmarks pionerer inden for bioinformatik, Søren Brunak. Han var hovedkraften bag oprettelsen af et center for bioinformatik på DTU i 1993. Bioinformatik er studiet af, hvordan man bruger datalogi og matematik til at bearbejde biologiske data.

»Lige nu så bliver det en faktor ti gange billigere hvert år at sekventere dna, så derfor vil mængden af data stige voldsomt fremover. Derfor får vi også behov for ti gange større ressourcer på it-siden for at håndtere, analysere og integrere data. Forskningsverdenen skal tage denne nye del af biologien alvorligt, så hukommelses- og lagerkapaciteten følger med,« siger han.

Behov for flere investeringer

Han understreger, at mens computerne ifølge den såkaldte Moores lov bliver dobbelt så hurtige hvert halvandet år til samme pris, så vokser indsamlingen af information om klodens dna altså endnu hurtigere. Derfor skal der yderligere investeringer til, hvis udviklingen inden for universiteternes it-udstyr skal følge med indsamlingen af data.

Artiklen fortsætter efter annoncen

»For biologer er det en unaturlig ting at skulle smide videnskabelige data ud. Men det kan blive konsekvensen, hvis man - som nu - hver gang man bruger 100 euro på at finde dna sekvenser, så investerer man mindre end én euro i it. Det er fjollet, eftersom man ikke længere rigtig kan tale om biologisk forskning uden at der er computere involveret. Computeren spiller en af hovedrollerne nu,« siger han.

Hvor skal data gemmes?

Problemet bliver efterhånden livligt diskuteret i bioinformatikkredse. Ved forrige uges årlige Bio-IT World Conference i Boston, USA, var et af hovedemnerne lige netop, om man skulle satse på at gemme data på bånd eller diske. For som nyhedsbrevet bioInform skriver efter konferencen, 'mens arbejdet med at indsamle data ... kun lige er begyndt, så står både store og små laboratorier allerede over for nogle store valg i forhold til, hvordan de skal lagre de terabytes af data, som sekvensteknologierne skaber'.

»Det er egentlig mærkeligt, at man har fokuseret så lidt på infrastrukturen; hvor man skulle gemme data fra laboratorierne. Man begyndte allerede for alvor at sekventere det humane genom i 1990. Man vidste, at data i form af milliarder af basepar i genomerne ville komme,« siger Søren Brunak.

Alligevel var der masser af universiteter, der først 10 til 15 år senere begyndte at oprette uddannelser og professorater inden for bioinformatik-området.

Artiklen fortsætter efter annoncen

»Vi var nogle af de absolut første i Danmark i 1993, der begyndte at holde kurser i, hvordan man bruger computere inden for biologi, mens den form for tværfaglighed på universiteterne i Danmark og Europa generelt kom langt senere,« siger han,

I USA og Asien var man tilgengæld lidt hurtigere til at bryde grænserne mellem datalogi og biologi, og det betyder, at Europa i dag stadig halter bagefter.

»Jeg tror, der var langt flere af patenterne på de humane gener, der var landet i Europa, hvis vi havde fokuseret på bioinformatik noget før,« siger Søren Brunak, der mener, at navnlig for et lille land som Danmark er det en god investering at sætte penge af til at forske i, hvordan man kan behandle og lagre de dna-informationer, som forskere over hele verden lige nu bringer frem i lyset.

»Forskningsverdenen kræver, at de kortlagte gener er tilgængelige for alle og derfor kan vi nyde meget godt af at kunne arbejde med alle de data, som hele verden er i gang med at generere til os,« siger han.

Søren Brunak

Født i 1958 i København, gift med tekstildesigner Pernille Fagerlund, har fire børn.

1976: Student fra Det Fri Gymnasium
1987: Cand.scient. (fysik) fra Niels Bohr Instituttet
1991: Ph.D. i bioinformatik, DTU
1990: **Seniorforsker ved Institut for Fysik, DTU
**1991:
Medstifter af Center for Kunstige Neurale Netværk
1993: Stifter af og centerleder for Center for Biologisk Sekvensanalyse, DTU
1993: Medlem af Danmarks Naturvidenskabelige Akademi
1997: Lektor ved Center for Biologisk Sekvensanalyse, DTU.
1999: Professor i bioinformatik
2002: Æresdoktor ved Stockholms Universitet
2004: Medlem af Det Kgl. Videnskabernes Selskab
2004: Modtager af Dir. Ib Henriksens pris for fremragende videnskabelig forskning
2006: Modtager af Villum Kann Rasmussens Forskningspris (Danmarks største forskerpris)
2006: Ingeniøren kårer Søren Brunak og hans kollegers publicering i Nature om, hvordan gener og proteiner aktiveres under forskellige trin i celledelingen
2007: Medlem af Welcome Trust (komiteen for Molecules, Genes and Cells)
2007: Medlem af European Research Council (komiteen for 'Genetics, Genomics, Bioinformatics and Systems Biology')
2007: Adjungeret professor ved Københavns Universitet, leder af afdelingen for Sygdomssystembiologi, Center for Proteinforskning på Panuminstituttet
 
Har publiceret over 150 artikler i peer-reviewede tidsskrifter, der er citeret mere end 11.000 gange, og er medforfatter til fem bøger. Derudover har han været hovedansøger til forskningsbevillinger for mere end 200 mio. kroner.

Ingen kommentarer endnu.  Start debatten

Tophistorier

Debatten
Vær med til at skabe en god debat ved at følge vores debatregler.

For at deltage i debatten skal du have en profil med adgang til at læse artiklen. eller opret en bruger.
settingsDebatvisning