Connecting research to society

Bio-Informatica

Bioinformatica is een veld dat zich richt op het bedenken en ontwikkelen van nieuwe methoden op het raakvlak van informatica en statistiek, die ons helpen het begrip van biologische processen te vergroten. Zo worden nieuwe rekenmethodes ontwikkeld voor het ontdekken van interessante patronen en eigenschappen in grote hoeveelheden biologische data in cohort studies.

De grote hoeveelheid gegevens die bij hedendaagse biologisch onderzoek wordt verzameld, zoals “sequencing” data en data over metabolieten, biedt grote kansen, maar ook uitdagingen. Zo vraagt het om innovatieve methoden om deze data te verwerken met een werkbare hoeveelheid rekentijd en computergeheugen. Bovendien betreft het metingen over een grote hoeveelheid verschillende biologische factoren, die allemaal op een verschillende, complexe, manier samen hangen met processen als veroudering, wat het vinden van deze samenhang tot een complexe taak maakt.

Hiertoe hebben wij rekenmethoden ontwikkeld om structurele varianten te vinden: wijzigingen aan het DNA of RNA, zoals duplicaten. Deze structurele varianten spelen mogelijk een rol in verschillende ziekteprocessen. Daarnaast hebben wij methoden ontwikkeld die het voor onderzoekers mogelijk maken om biologische sequenties op een consistente wijze met elkaar te vergelijken. Dit is verwerkt in de mutalizer website, waar onderzoekers zulke omschrijvingen kunnen laten genereren.


hier werken wij De grote hoeveelheid gegevens die bij hedendaagse biologisch onderzoek wordt verzameld, zoals “sequencing” data en data over metabolieten, biedt grote kansen, maar ook uitdagingen. Zo vraagt het om innovatieve methoden om deze data te verwerken met een werkbare hoeveelheid rekentijd en computergeheugen. Bovendien betreft het metingen over een grote hoeveelheid verschillende biologische factoren, die allemaal op een verschillende, complexe, manier samen hangen met processen als veroudering, wat het vinden van deze samenhang tot een complexe taak maakt.

Tevens werken wij aan classificatie en clustering modellen waarin verschillende soorten informatie worden samengebracht om te proberen de kans te schatten dat iemand met een bepaald biologisch profiel een ziekte zal ontwikkelen. Hierbij richten wij ons bijvoorbeeld op zogenaamde "semi-supervised” modellen, waar extra informatie beschikbaar is in de vorm van deels geobserveerde data punten.