Foto: Privat

Forskning

Data science som videnskabelig metode

Philippe Bonnet, der er professor og leder af forskningsgruppen Data-Intensive Systems and Application ved IT-Universitetet i København, modtog i juni den prestigefyldte SIGMOD Contributions Award for sin forskning i videnskabelig reproducerbarhed i publikationer om databaser.

Hvad er computational reproducerbarhed?

Reproducerbarhed er en hjørnesten i den videnskabelige metode, fordi det er nødvendigt at fastslå gyldigheden af eksperimentelle resultater og således vurdere robustheden af de beviser, der understøtter en teori eller en påstand. Computational reproducerbarhed handler om at opnå konsistente resultater med data science ved hjælp af de samme input data, beregningsmetoder og analysebetingelser. Det hænger sammen med replikabilitet, som handler om at opnå konsistente resultater på tværs af undersøgelser, der sigter mod at besvare det samme videnskabelige spørgsmål, med egne data. Disse to definitioner blev slået fast i december 2019 af US National Academy of Sciences.

Hvad er problemet?

Computational reproducerbarhed og replikabilitet opnås med passende værktøjer og praksis. Ideelt set skal det være lige så nemt at reproducere et computational eksperiment som at læse en artikel om dets resultat. Det kræver, at software og data er tilgængelige, at der kan anvendes passende hardwareressourcer, og at systemet konfigureres korrekt. Der er blevet udviklet værktøjer i de seneste år, men det er stadigvæk en udfordring at håndtere personlige data, fortrolig software eller konfiguration af high-performance computers.

Hvem har gavn af resultaterne fra din forskning?

Nu om dage er reproducerbarhed af data science meget relevant i et række områder fra akkreditering af medicinsk udstyr til gyldighed af big data studier. Det er også nødvendigt til at sikre passende arkivering af forskningsresultater og publicering af data sets, så forskere kan bygge videre på eksisterende resultater.

Hvad er det ultimative mål for din forskning?

Målet er, at data science bliver en integreret del af den videnskabelige metode, sammen med de teoretiske og empiriske grene.


Læs også...

Ole Tange, it-politisk rådgiver i PROSA, har i denne uge indsendt en klage over Danmarks Radio til Datatilsynet. Det skyldes DRs krav om obligatorisk…

Er du på jagt efter et nyt job i it-branchen? Og er du i tvivl om, hvad virksomhederne især kigger efter? PROSAbladet har spurgt en række…

Fra Baltikums største sciencepark i udkanten af Tallinn sikrer Tehnopol, at hundredvis af startups kommer flyvefærdigt ud i virkeligheden. De får…

Estiske børn og unge får praktisk talt tech ind med modermælken, da it og tech-gadgets er en helt central del af hverdagen i både børnehaver,…

I Estland har borgerne kunne stemme digitalt siden 2005. Der har været kritik og debat, men i dag er det mere end halvdelen af esterne, der bruger…

Hvis man i Estland gerne vil skifte spor i sin karriere, er der en lang række muligheder for at videreuddanne sig inden for it. Skoler og online…

I denne udgave af PROSAbladet har vi lavet et tema-nummer om Estland. Det er sjældent, at vi giver så meget spalteplads til et tema – men det baltiske…

Pulserende krea-værksted klæder estiske børn på med både tech-skills og startup-mentalitet. Der er ingen læreplaner eller kedelige eksamener, men 3D…

Det minder om en blanding af X Factor og Den store bagedyst, og det lægger på 15. år gaderne øde i Estland. Velkommen til tv-talentshowet Rakett69,…

Estland har rykket sig ufattelig langt de seneste 30 år – men hvad skal der ske nu? En af udfordringerne er, at Estland kommer til at mange hænder og…