Foto: Privat

Forskning

Data science som videnskabelig metode

Philippe Bonnet, der er professor og leder af forskningsgruppen Data-Intensive Systems and Application ved IT-Universitetet i København, modtog i juni den prestigefyldte SIGMOD Contributions Award for sin forskning i videnskabelig reproducerbarhed i publikationer om databaser.

Hvad er computational reproducerbarhed?

Reproducerbarhed er en hjørnesten i den videnskabelige metode, fordi det er nødvendigt at fastslå gyldigheden af eksperimentelle resultater og således vurdere robustheden af de beviser, der understøtter en teori eller en påstand. Computational reproducerbarhed handler om at opnå konsistente resultater med data science ved hjælp af de samme input data, beregningsmetoder og analysebetingelser. Det hænger sammen med replikabilitet, som handler om at opnå konsistente resultater på tværs af undersøgelser, der sigter mod at besvare det samme videnskabelige spørgsmål, med egne data. Disse to definitioner blev slået fast i december 2019 af US National Academy of Sciences.

Hvad er problemet?

Computational reproducerbarhed og replikabilitet opnås med passende værktøjer og praksis. Ideelt set skal det være lige så nemt at reproducere et computational eksperiment som at læse en artikel om dets resultat. Det kræver, at software og data er tilgængelige, at der kan anvendes passende hardwareressourcer, og at systemet konfigureres korrekt. Der er blevet udviklet værktøjer i de seneste år, men det er stadigvæk en udfordring at håndtere personlige data, fortrolig software eller konfiguration af high-performance computers.

Hvem har gavn af resultaterne fra din forskning?

Nu om dage er reproducerbarhed af data science meget relevant i et række områder fra akkreditering af medicinsk udstyr til gyldighed af big data studier. Det er også nødvendigt til at sikre passende arkivering af forskningsresultater og publicering af data sets, så forskere kan bygge videre på eksisterende resultater.

Hvad er det ultimative mål for din forskning?

Målet er, at data science bliver en integreret del af den videnskabelige metode, sammen med de teoretiske og empiriske grene.


Læs også...

Det var en helt ny fornemmelse, da Søren tidligere på året blev ramt af stress, for han havde aldrig oplevet stresssymptomer før. Søren har arbejdet i…

I 1999 havnede Berit Søgaard mere eller mindre tilfældigt i IT-branchen, og hun har arbejdet her lige siden. I dag er hun compliancedirektør i Visma,…

Nettet er proppet til randen med websider, som kan hjælpe dig med det ene eller andet eller har så nørdet viden, at de med fordel kan besøges.

Unge tech-folk fortæller om deres håb og drømme for fremtiden. Danske virksomheder kigger mod et tysk eksporteventyr. Forfatter sætter spot på Kina og…

26-årige Francesca Tremulo rejste til Danmark fra Italien for tre år siden for at realisere drømmen om en fremtid i spilbranchen. Hun er uddannet…

Kinas tech fungerer og er udviklet i benhård konkurrence til at være bedst og billigst. Talentmassen er enorm, og der er prestige og attraktive…

Alberte Viendahl er 25 år og har læst multimediedesign på KEA. Hun er blevet vild med at kode og nørde, og nu vil hun gerne tage en top up-uddannelse…

Benjamin Elias Harris er 27 år, og han har gået på datamatikerlinjen på KEA. Han startede egentlig med at læse engelsk på Københavns Universitet, men…

28-årige Yousra Diab arbejdede i flere år som socialrådgiver, inden hun tog springet og startede på datamatikeruddannelsen. Det har været svært at…

26-årige Sophie Ankjær Andersen har læst multimediedesign på KEA. Hun drømmer om, at hun i fremtiden skal tage sit arbejde med til Bali og arbejde…