“Hvad siger du til at blive ført ned i kælderen under DR Byen og bedt om at udpege Jens Okking, Jørgen de Mylius og Holger Juul Hansen på gamle billeder i timevis?”, lød invitationen. Jo, det lød meget tiltrækkende. Som en god lørdag. Så jeg tog med på Crowdsource4dk; et arrangement, der skal gøre vores kulturarv tilgængelig for flere danskere.
DR og de gamle billeder
DR har netop indscannet 77.000 pressebilleder fra perioden mellem 1955 og 1995. Men de aner ikke, hvad der er på dem. Den gamle metode ville gå ud på at sætte bibliotekartyper til at beskrive billedernes indhold på en konsekvent måde. Men den slags koster penge, og riget fattes penge.
Måske man kunne crowdsource det? Få folk rundt om i landet til at sidde og hjælpe til. Folk vil ikke få penge for arbejdet, men kan betragte det som et spil, hvor de også gør en kulturinstitution en tjeneste.
Der er en umiddelbar tilfredsstillelse i at udbryde: “Næææh, Paul Hagen i … i … det må være i Huset på Christianshavn!” - og en langsigtet tilfredsstillelse i at vide, at man har gjort lidt for danmarkshistorien, kulturhistorien.
Teknikken
Ved et tidligere arrangement, Hack4dk, fik it-nørd Bo Henriksen banket et system sammen, der spiser alle DR's ubeskrevede billeder og derefter giver folk mulighed for at markere et sted på billedet og skrive et tag, en etiket. Klik Jens Okking midt på næsen, og skriv “Jens Okking” i den tekstboks, der springer frem. Eller klik ude i siden, og skriv “En by i provinsen”.
Det var dette system, der blev arbejdet med i kælderen under DR Byen den lørdag eftermiddag.
Den ene del af festen var at forbedre systemet: “Hvad med belønningslyde, når man indsender? Stor fanfare ved hvert 25. billede?”
“Mulighed for at blære sig på Facebook? Highscores! Eller hvad med, at der trækkes lod om rundvisning i DR ved Jørgen de Mylius blandt de 10 mest aktive billed-crowdsourcere?”
“Skulle vi ikke gøre som rigtige bibliotekarer og dele opmærkningen op i forskellige taksonomier? Personer, tv-programmer og årstal skal i hver deres kasse, så vi senere kan lave bedre oversigter. Vi skal også have batch-opmærkning, hvor vi kan opmærke en række billeder med samme tag i ét hug!”
“Kan vi ikke lade Googles billed-API genkende personerne? Det er vildt effektivt!”
Og så videre, og så videre.
Det andet formål med arrangementet var simpelthen at bruge systemet og få proppet nogle data på billederne. Blive enige om, at dette billede måtte være af Otto Leisner i “Pladeparade”, det næste af doktor Lieberkind, det tredje af Casper Christensen i “Transit” og så fremdeles.
Nationalmuseet var også med
DR var ikke eneste institution, der udbad sig offentlighedens hjælp den dag. Nationalmusset havde også tusinder af billeder med. Her havde man lavet en tjeneste, der gjorde det let at geo-tagge billederne - altså at fortælle, hvor i landet de var taget.
Fra Rigsarkivet lød der en bøn om at indtaste vestindiske arkivalier: Protokoller over til- og frarejsende, folketællinger og meget andet. Dengang Danmark havde kolonier, skrev man med gotiske bogstaver - i hånden - noget, der er forholdsvis svært for computere at genkende. Der er stadig brug for mennesker.
Et af de finest udførte crowdsource-værktøjer var Cosound Voxvip. Her skulle folk genkende stemmer fra radioen i en ret lækker brugerflade og fik som tak plads på highscore-listen - og så var der endda vinpræmie til dagens flittigste bidragsyder. I alt var der ni store projekter, som bad om offentlighedens hjælp.
Mange hænder gør arbejdet let
Crowdsourcing er fascinerende, fordi mange hænder gør arbejdet let, og den slags kunne man ikke gøre for 20 år siden. Nu, hvor alverden kan mødes i virtuelle arbejdsrum på nettet, kan alle være med. Kan man lokke folk væk fra syvkabalen eller Candy Crush Saga, kan befolkningens kognitive overskud bruges til noget samfundsnyttigt.
Men hvem bør ideelt sidde og programmere og tilføje metadata? I gamle dage var svaret let: De fastansatte på institutionerne. De plejede også at være de mest velegnede. Men i dag, hvor vi er gået væk fra kartotekskortene og over i meget komplicerede web-applikationer, har de fastansatte ikke nødvendigvis ekspertisen til at bygge det bedste system til inddatering.
Ikke engang DR ser ud til at have programmørmuskel nok til at kunne rigge billedgenkendelse til. Faktisk havde kun et ud af de ni projekter, stemmegenkendelse, en ordentlig programmørmuskel - udlånt gratis af DTU.
Indtasterne er det også lidt sværere at styre i et crowdsource-projekt. Med ansatte på månedsløn kan man forvente, at de leverer nogenlunde aftalt mængde, til aftalt tid, i aftalt kvalitet. Med amatører er det klart noget andet. De skal stryges med hårene, og det er svært for dem at holde gejsten oppe. Ligeledes er der ikke de store sanktionsmuligheder, hvis en eller anden klump bytter om på Gorm og Gregers og fejlopmærker 200 billeder.
Kommandør Facebook, de venter på dig
Crowsource4dk har naturligvis fået egen hjemmeside under Rigsarkivet. Her præsenteres for tiden ni projekter, der både savner programmørmuskel og indtastning.
Er du programmør, kunne lidt hjælp her danne basis for et sejt eksamensprojekt.
Sidder du for længe på Facebook og liker indlæg, kunne du med fordel for både dig selv og danmarkshistorien springe på et crowdsourcing-projekt og klikke lidt mere konstruktivt.