Foto: Privat

Forskning

Data science som videnskabelig metode

Philippe Bonnet, der er professor og leder af forskningsgruppen Data-Intensive Systems and Application ved IT-Universitetet i København, modtog i juni den prestigefyldte SIGMOD Contributions Award for sin forskning i videnskabelig reproducerbarhed i publikationer om databaser.

Hvad er computational reproducerbarhed?

Reproducerbarhed er en hjørnesten i den videnskabelige metode, fordi det er nødvendigt at fastslå gyldigheden af eksperimentelle resultater og således vurdere robustheden af de beviser, der understøtter en teori eller en påstand. Computational reproducerbarhed handler om at opnå konsistente resultater med data science ved hjælp af de samme input data, beregningsmetoder og analysebetingelser. Det hænger sammen med replikabilitet, som handler om at opnå konsistente resultater på tværs af undersøgelser, der sigter mod at besvare det samme videnskabelige spørgsmål, med egne data. Disse to definitioner blev slået fast i december 2019 af US National Academy of Sciences.

Hvad er problemet?

Computational reproducerbarhed og replikabilitet opnås med passende værktøjer og praksis. Ideelt set skal det være lige så nemt at reproducere et computational eksperiment som at læse en artikel om dets resultat. Det kræver, at software og data er tilgængelige, at der kan anvendes passende hardwareressourcer, og at systemet konfigureres korrekt. Der er blevet udviklet værktøjer i de seneste år, men det er stadigvæk en udfordring at håndtere personlige data, fortrolig software eller konfiguration af high-performance computers.

Hvem har gavn af resultaterne fra din forskning?

Nu om dage er reproducerbarhed af data science meget relevant i et række områder fra akkreditering af medicinsk udstyr til gyldighed af big data studier. Det er også nødvendigt til at sikre passende arkivering af forskningsresultater og publicering af data sets, så forskere kan bygge videre på eksisterende resultater.

Hvad er det ultimative mål for din forskning?

Målet er, at data science bliver en integreret del af den videnskabelige metode, sammen med de teoretiske og empiriske grene.


Læs også...

Du burde måske kende Alex Bores. For Big Tech kender ham, de frygter ham, og har lavet en super PAC, hvor de bruger millioner af dollars på tilsværte…

Hvis ikke vi vidste det før, så ved vi det nu. AI er rå geopolitiske muskler, som magtspillere helst holder til kroppen. Det lærte vi, da Anthropic i…

Nye AI-værktøjer kan generere apps og hjemmesider på få minutter. For UX-designere flytter arbejdet sig derfor fra at tegne alt selv til at vurdere,…

Når medarbejdere hele tiden skal vurdere AI-output, kan gevinsten hurtigt blive afløst af mental tåge, flere fejl og sværere beslutninger. Det kræver…

AI-agenter ændrer spillereglerne: Derfor skal virksomheder bygge anderledes

Jeanette Falk er assistant professor ved Department of Computer Science og vokset op med Doom og GTA, og vil bruge sin kærlighed til spil og viden om…

AI-agenter, særligt Claude Code fra Anthropic, har de seneste måneder forandret Juri Jensens måde at arbejde på. Han har arbejdet med IT siden…

Live coding vender god programmeringspraksis på hovedet: Her skrives koden direkte foran publikum, mens fejl, improvisation og fælles fumlen bliver en…

Det er en forpustet og bekymret tid for mange i IT-branchen. Måske fordi der er en følelse af, at toget kører nu, når det handler om at mestre og gøre…

Fagforeninger og politikere har mere end travlt, hvis de skal bjærge arbejdsmarked og overenskomster gennem AI og teknologiske landvindinger. Det…