Foto: Privat

Forskning

Data science som videnskabelig metode

Philippe Bonnet, der er professor og leder af forskningsgruppen Data-Intensive Systems and Application ved IT-Universitetet i København, modtog i juni den prestigefyldte SIGMOD Contributions Award for sin forskning i videnskabelig reproducerbarhed i publikationer om databaser.

Hvad er computational reproducerbarhed?

Reproducerbarhed er en hjørnesten i den videnskabelige metode, fordi det er nødvendigt at fastslå gyldigheden af eksperimentelle resultater og således vurdere robustheden af de beviser, der understøtter en teori eller en påstand. Computational reproducerbarhed handler om at opnå konsistente resultater med data science ved hjælp af de samme input data, beregningsmetoder og analysebetingelser. Det hænger sammen med replikabilitet, som handler om at opnå konsistente resultater på tværs af undersøgelser, der sigter mod at besvare det samme videnskabelige spørgsmål, med egne data. Disse to definitioner blev slået fast i december 2019 af US National Academy of Sciences.

Hvad er problemet?

Computational reproducerbarhed og replikabilitet opnås med passende værktøjer og praksis. Ideelt set skal det være lige så nemt at reproducere et computational eksperiment som at læse en artikel om dets resultat. Det kræver, at software og data er tilgængelige, at der kan anvendes passende hardwareressourcer, og at systemet konfigureres korrekt. Der er blevet udviklet værktøjer i de seneste år, men det er stadigvæk en udfordring at håndtere personlige data, fortrolig software eller konfiguration af high-performance computers.

Hvem har gavn af resultaterne fra din forskning?

Nu om dage er reproducerbarhed af data science meget relevant i et række områder fra akkreditering af medicinsk udstyr til gyldighed af big data studier. Det er også nødvendigt til at sikre passende arkivering af forskningsresultater og publicering af data sets, så forskere kan bygge videre på eksisterende resultater.

Hvad er det ultimative mål for din forskning?

Målet er, at data science bliver en integreret del af den videnskabelige metode, sammen med de teoretiske og empiriske grene.


Læs også...

I december 2023 startede 25-årige Emil i cyberværnepligten på Ryes Kaserne i Fredericia. Han håber, at han med den særlige værnepligt i bagagen kan…

Når det hele brænder, og et hackerangreb er i gang, bevarer Christian Henriksen roen og overblikket – det har han nemlig lært i Forsvaret, hvor han…

For fire år siden startede de første cyberværnepligtige i Forsvaret, og nu er hold otte i gang på kasernen i Fredericia. Forløbet klæder de unge på…

Det er et stort skifte at gå fra den "grønne" værnepligt til cyberværnepligten, fortæller 20-årige Ruben. Cyber ops-forløbet, hvor de værnepligtige…

23-årige Christian havde arbejdet med it i flere år, inden han startede i cyberværnepligten. Han drømmer om at arbejde i Forsvaret fremover, for her…

På få minutter komponerede Ole Tange en PROSA-slagsang med tekst fra ChatGPT, og med musik, sang, beats og kor fra Udio.com. "Det fungerer, det er…

Natasha Friis Saxberg er en af de mest markante stemmer, når det handler om at sætte dagsordener inden for it og tech herhjemme. Hun er direktør for…

Selvom Anna igen og igen fortalte sine ledere, at den kode, hun og kollegerne arbejdede med, ikke var god nok, blev der ikke lyttet – men der blev…

Dagligt hører vi om nye hackerangreb, og frygten for, at store angreb kan lægge vores samfund ned, bliver mere og mere reel. Nye it-sikkerhedsregler…

I år har 5.187 personer søgt ind på en it-uddannelse via kvote 2. Det er 10 pct. flere end i 2023.