Foto: Privat

Forskning

Data science som videnskabelig metode

Philippe Bonnet, der er professor og leder af forskningsgruppen Data-Intensive Systems and Application ved IT-Universitetet i København, modtog i juni den prestigefyldte SIGMOD Contributions Award for sin forskning i videnskabelig reproducerbarhed i publikationer om databaser.

Hvad er computational reproducerbarhed?

Reproducerbarhed er en hjørnesten i den videnskabelige metode, fordi det er nødvendigt at fastslå gyldigheden af eksperimentelle resultater og således vurdere robustheden af de beviser, der understøtter en teori eller en påstand. Computational reproducerbarhed handler om at opnå konsistente resultater med data science ved hjælp af de samme input data, beregningsmetoder og analysebetingelser. Det hænger sammen med replikabilitet, som handler om at opnå konsistente resultater på tværs af undersøgelser, der sigter mod at besvare det samme videnskabelige spørgsmål, med egne data. Disse to definitioner blev slået fast i december 2019 af US National Academy of Sciences.

Hvad er problemet?

Computational reproducerbarhed og replikabilitet opnås med passende værktøjer og praksis. Ideelt set skal det være lige så nemt at reproducere et computational eksperiment som at læse en artikel om dets resultat. Det kræver, at software og data er tilgængelige, at der kan anvendes passende hardwareressourcer, og at systemet konfigureres korrekt. Der er blevet udviklet værktøjer i de seneste år, men det er stadigvæk en udfordring at håndtere personlige data, fortrolig software eller konfiguration af high-performance computers.

Hvem har gavn af resultaterne fra din forskning?

Nu om dage er reproducerbarhed af data science meget relevant i et række områder fra akkreditering af medicinsk udstyr til gyldighed af big data studier. Det er også nødvendigt til at sikre passende arkivering af forskningsresultater og publicering af data sets, så forskere kan bygge videre på eksisterende resultater.

Hvad er det ultimative mål for din forskning?

Målet er, at data science bliver en integreret del af den videnskabelige metode, sammen med de teoretiske og empiriske grene.


Læs også...

Danmarks Radios krav om login lever ikke op til GDPR-regler. Det fastslår IT-politisk rådgiver, Ole Tange, efter at have set et svarskrift fra…

Hvor langt skal du egentlig acceptere at skulle transportere dig ekstra, når dit arbejdssted flytter? Læs med her.

Stor jubel i Landstingssalen på Christiansborg, da høring om datasuverænitet langt hen ad vejen handlede om at smide big tech på porten og lukke…

Arbejdsgiver har ansvar for at sikre arbejdsmiljøet ved hjemmearbejde. Det fastslår en ny afgørelse fra Højesteret, hvor en kvinde kom til skade under…

Kvinder tjener i snit 12,6 procent mindre end mænd, og kvinders pensionsopsparing er 26 procent mindre end mænds. Det er to af de kedelige facts, som…

Der er tilfredshed i PROSA, efter at PET-lovændring er udskudt. IT-fagforeningen sendte forleden et åbent brev til justitsministeren, som påpegede…

Vi har hørt det uendelig mange gange: Der mangler kvinder i tech. Og vi får gang på gang at vide, at det er et problem, at piger ikke er interesserede…

Big tech er ved at kvæle rigtige fællesskaber med zombie-scrolling. Den faglige kamp har brug for, at de unge møder op og giver en injektion af…

Behandling eller undersøgelser mod barnløshed sidestilles med almindeligt sygefravær, og som funktionær har du derfor også ret til fri med løn for at…

Arbejdsmiljøet hos den danske IT-gigant er så problematisk, at de IT-professionelles fagforening nu advarer unge mod ansættelse. ”Det er prestige over…