Frivillige mødes i DR Byen for at hjælpe til med at opmærke i 77.000 gamle pressefoto. De hjælper også til med at beskrive tidlige udsendelser fra DR's teknologimagasin Harddisken og genkende DR-radiostemmer.

Til Crowdsource4dk

“Hvad siger du til at blive ført ned i kælderen under DR Byen og bedt om at udpege Jens Okking, Jørgen de Mylius og Holger Juul Hansen på gamle billeder i timevis?”, lød invitationen. Jo, det lød meget tiltrækkende. Som en god lørdag. Så jeg tog med på Crowdsource4dk; et arrangement, der skal gøre vores kulturarv tilgængelig for flere danskere.

DR og de gamle billeder

DR har netop indscannet 77.000 pressebilleder fra perioden mellem 1955 og 1995. Men de aner ikke, hvad der er på dem. Den gamle metode ville gå ud på at sætte bibliotekartyper til at beskrive billedernes indhold på en konsekvent måde. Men den slags koster penge, og riget fattes penge.

Måske man kunne crowdsource det? Få folk rundt om i landet til at sidde og hjælpe til. Folk vil ikke få penge for arbejdet, men kan betragte det som et spil, hvor de også gør en kulturinstitution en tjeneste.

Der er en umiddelbar tilfredsstillelse i at udbryde: “Næææh, Paul Hagen i … i … det må være i Huset på Christianshavn!” - og en langsigtet tilfredsstillelse i at vide, at man har gjort lidt for danmarkshistorien, kulturhistorien.

Teknikken

Ved et tidligere arrangement, Hack4dk, fik it-nørd Bo Henriksen banket et system sammen, der spiser alle DR's ubeskrevede billeder og derefter giver folk mulighed for at markere et sted på billedet og skrive et tag, en etiket. Klik Jens Okking midt på næsen, og skriv “Jens Okking” i den tekstboks, der springer frem. Eller klik ude i siden, og skriv “En by i provinsen”.

Det var dette system, der blev arbejdet med i kælderen under DR Byen den lørdag eftermiddag.

Den ene del af festen var at forbedre systemet: “Hvad med belønningslyde, når man indsender? Stor fanfare ved hvert 25. billede?”

“Mulighed for at blære sig på Facebook? Highscores! Eller hvad med, at der trækkes lod om rundvisning i DR ved Jørgen de Mylius blandt de 10 mest aktive billed-crowdsourcere?”

“Skulle vi ikke gøre som rigtige bibliotekarer og dele opmærkningen op i forskellige taksonomier? Personer, tv-programmer og årstal skal i hver deres kasse, så vi senere kan lave bedre oversigter. Vi skal også have batch-opmærkning, hvor vi kan opmærke en række billeder med samme tag i ét hug!”

“Kan vi ikke lade Googles billed-API genkende personerne? Det er vildt effektivt!”
Og så videre, og så videre.

Det andet formål med arrangementet var simpelthen at bruge systemet og få proppet nogle data på billederne. Blive enige om, at dette billede måtte være af Otto Leisner i “Pladeparade”, det næste af doktor Lieberkind, det tredje af Casper Christensen i “Transit” og så fremdeles.

Nationalmuseet var også med

DR var ikke eneste institution, der udbad sig offentlighedens hjælp den dag. Nationalmusset havde også tusinder af billeder med. Her havde man lavet en tjeneste, der gjorde det let at geo-tagge billederne - altså at fortælle, hvor i landet de var taget.

Fra Rigsarkivet lød der en bøn om at indtaste vestindiske arkivalier: Protokoller over til- og frarejsende, folketællinger og meget andet. Dengang Danmark havde kolonier, skrev man med gotiske bogstaver - i hånden - noget, der er forholdsvis svært for computere at genkende. Der er stadig brug for mennesker.

Et af de finest udførte crowdsource-værktøjer var Cosound Voxvip. Her skulle folk genkende stemmer fra radioen i en ret lækker brugerflade og fik som tak plads på highscore-listen - og så var der endda vinpræmie til dagens flittigste bidragsyder. I alt var der ni store projekter, som bad om offentlighedens hjælp.

Mange hænder gør arbejdet let

Crowdsourcing er fascinerende, fordi mange hænder gør arbejdet let, og den slags kunne man ikke gøre for 20 år siden. Nu, hvor alverden kan mødes i virtuelle arbejdsrum på nettet, kan alle være med. Kan man lokke folk væk fra syvkabalen eller Candy Crush Saga, kan befolkningens kognitive overskud bruges til noget samfundsnyttigt.

Men hvem bør ideelt sidde og programmere og tilføje metadata? I gamle dage var svaret let: De fastansatte på institutionerne. De plejede også at være de mest velegnede. Men i dag, hvor vi er gået væk fra kartotekskortene og over i meget komplicerede web-applikationer, har de fastansatte ikke nødvendigvis ekspertisen til at bygge det bedste system til inddatering.

Ikke engang DR ser ud til at have programmørmuskel nok til at kunne rigge billedgenkendelse til. Faktisk havde kun et ud af de ni projekter, stemmegenkendelse, en ordentlig programmørmuskel - udlånt gratis af DTU.

Indtasterne er det også lidt sværere at styre i et crowdsource-projekt. Med ansatte på månedsløn kan man forvente, at de leverer nogenlunde aftalt mængde, til aftalt tid, i aftalt kvalitet. Med amatører er det klart noget andet. De skal stryges med hårene, og det er svært for dem at holde gejsten oppe. Ligeledes er der ikke de store sanktionsmuligheder, hvis en eller anden klump bytter om på Gorm og Gregers og fejlopmærker 200 billeder.

Kommandør Facebook, de venter på dig

Crowsource4dk har naturligvis fået egen hjemmeside under Rigsarkivet. Her præsenteres for tiden ni projekter, der både savner programmørmuskel og indtastning.

Er du programmør, kunne lidt hjælp her danne basis for et sejt eksamensprojekt.
Sidder du for længe på Facebook og liker indlæg, kunne du med fordel for både dig selv og danmarkshistorien springe på et crowdsourcing-projekt og klikke lidt mere konstruktivt.


Læs også...

Der er tilfredshed i PROSA, efter at PET-lovændring er udskudt. IT-fagforeningen sendte forleden et åbent brev til justitsministeren, som påpegede…

Vi har hørt det uendelig mange gange: Der mangler kvinder i tech. Og vi får gang på gang at vide, at det er et problem, at piger ikke er interesserede…

Big tech er ved at kvæle rigtige fællesskaber med zombie-scrolling. Den faglige kamp har brug for, at de unge møder op og giver en injektion af…

Behandling eller undersøgelser mod barnløshed sidestilles med almindeligt sygefravær, og som funktionær har du derfor også ret til fri med løn for at…

Arbejdsmiljøet hos den danske IT-gigant er så problematisk, at de IT-professionelles fagforening nu advarer unge mod ansættelse. ”Det er prestige over…

Den danske IT-branche omsatte for knap 330 milliarder kroner sidste år, hvilket er rekord. Fremgangen sker til trods for, at det samlede antal ansatte…

Det seneste halve år har PROSA oplevet, at antallet af henvendelser om opsigelser overstiger antallet af ansættelseskontrakter. ”Det er nyt og uvant,…

Kommissionens udspil omkring at gøre EU førende inden for AI-udvikling blev offentliggjort 9. april. Der skal blandt andet oprettes AI-gigafabrikker…

I 2026 åbner SDU et nyt campus i Vejle, som skal have fokus på IT- og STEM-uddannelser. Nu har uddannelses- og forskningsministeren godkendt de første…