”Vi vil gerne vide alt om alle, men intet om den enkelte”

Har du lyst til at vide, om du ud fra statistisk sandsynlighed er en F3’er ”Familie med formue og forstand” eller måske en G2’er ”Vise og velstillede veteraner”, så hop ind på Geomatics hjemmeside, og skriv din adresse ind under menupunktet Klassifikation. I nogle tilfælde er den udførlige typebeskrivelse nærmest spot-on, i andre tilfælde må man konstatere, at det her handler om opsummerede data på en større gruppe mennesker, hvor du tydeligvis er atypisk i forhold til dine naboer.

– Vi plejer at sige, at vi gerne vil vide alt om alle, men intet om den enkelte, forklarer Martin K. Glarvig.

Han er direktør og stifter af Geomatic, hvis forretning er geografisk og demografisk analyse baseret på meget store mængder statistisk data. Resultatet bruges til at inddele danskerne i forskellige typer, som kan anvendes til business intelligence og segmenteringsformål.

Mange offentlige kunder

Kunderne er både private virksomheder, der vil målrette deres markedsføring mod specifikke kundesegmenter og offentlige virksomheder, der anvender de forædlede data til deres planlægning. Geomatic har således en tredjedel af de danske kommuner på referencelisten. 

– Ved at anvende vores data kan kommunerne eksempelvis kortlægge den demografiske profil på velfungerende områder i en by, hvilket kan være et meget væsentlig beslutningsgrundlag i forhold til planlægning af nye bydele, fortæller Martin K. Glarvig, som er geodæt af uddannelse og en af pionererne herhjemme, når det gælder om at lave forretning på basis af offentlige data.

I 2001 blev ejendoms- og adressedata lagt ud som åbne data, og han øjnede med det samme nogle muligheder, ikke mindst for forsikringsselskaber, der nu ville kunne graduere deres tariffer ned på meget mindre enheder end blot et postnummer, og for banker, der kunne benytte data til risikovurdering i forbindelse med långivning. I 2002 stiftede han derfor Geomatic, der i dag tæller 36 medarbejdere. 

Det handler om statistik

Martin K. Glarvig understreger gentagne gange, at Geomatic beskæftiger sig med statistik og ikke med at indsamle viden om den enkelte. 

– Det er ulovligt at indsamle og lagre information om enkeltpersoner uden et samtykke, og for vores kunder er det også uinteressant, siger han.

Der findes ikke en standardiseret definition af, hvad statistik er. Så afgrænsningen mellem indsamling af informationer om en gruppe af personer i modsætning til én person er ikke knivskarp. Danmarks Statistik har nogle retningslinjer, som man følger hos Geomatic, men Martin K. Glarvig kunne godt tænke sig nogle generelle regler.

– Det kunne være en god idé med nogle brancheetiske regler på området, eksempelvis hvor stor en gruppe skal være, før vi kan definere det som statistik, siger han.

Datakvaliteten er det vigtigste

Input til dataanalyserne kommer fra en lang række kilder. Geomatic køber stort ind hos Danmarks Statistik og Gallup Indeks Danmark samt abonnerer på en lang række af de offentlige registre som CPR, CVR og BBR. Martin K. Glarvig ser positivt på frikøbet af grunddata i Grunddataprogrammet.

– Frikøbet af offentlige grunddata vil uden tvivl kunne fremme innovationen, da det er blevet meget nemmere at eksperimentere med nye produkter og forretningsområder, men lige nu ser jeg det mest som en omstrukturering i den måde, hvorpå det offentlige håndterer udvekslingen af data internt, siger han.

Sammen med løn er indkøb af data den klart tungeste post på udgiftssiden hos Geomatic, så han hilser velkommen, at nogle data nu bliver gratis. En høj datakvalitet er dog vigtigere, end at data er gratis.

– For en etableret aktør som Geomatic er det ikke afgørende, at visse offentlige data er gratis. Vi er vant til at betale for data, ikke mindst fra Danmarks Statistik, hvis data ikke er frikøbt, siger han og fortsætter:

– Det er meget vigtigere, at man kan stole på data, og der må vi sige, at data i de bagvedliggende offentlige registre, eksempelvis BBR og CVR, i en del tilfælde er uhensigtsmæssige hvis ikke ligefrem fejlbehæftede. Rent faktisk har vi haft stor succes med at vedligeholde vores eget adresseregister, da det for vores kunder kan være afgørende at have en hit rate på tæt på 100 procent på korrekte adresser frem for måske 95 procent fra det offentlige register.

Som eksempler på fejl i BBR nævner Martin K. Glarvig, at i nogle kommuner bor helt op til fem procent af indbyggerne tilsyneladende i bygninger, der ikke er godkendt til beboelse, og der er indrettet børnehaver i driftsbygninger til landbrug. I CVR er der ingen validering på adresser, så man kan oprette et firma, der i forhold til BBR ikke giver mening, for eksempel en større produktionsvirksomhed på tredje sal i et boligbyggeri!

Han vil gerne være med til at højne datakvaliteten i de bagvedliggende registre, men savner en effektiv og nemt tilgængelig mulighed for at melde tilbage til registrene, hvis man finder fejl. I den aktuelle situation, hvor virksomheden selv skal stå for en del af kvalitetssikringen, kunne han faktisk også godt bruge nogle flere medarbejdere i form af dataspecialister og systemudviklere.

Inden for lovens rammer

Ud over data fra offentlige registre og fra Danmarks Statistik er en meget væsentlig datakilde for Geomatic vores adfærd på nettet, som kortlægges via cookies på de enkelte enheder. Man har aftaler med en række websites, hvor Geomatic får lov til at lægge cookies på brugerens enhed, når de kommer forbi sitet. De opsamlede data kan så dels bruges af firmaet bag websitet, dels af Geomatic i virksomhedens klassifikationsarbejde. Data indsamles alene anonymt og følger IAB’s (Interactive Advertising Bureau) internationale branchestandard for indsamling af statistik via cookies - en standard, der inddeler vores interesser og adfærd i 300 generelle kategorier.

Konkret sker følgende: Når man tilgår et website, hvor Geomatic har en aftale, lægges en cookie på enheden. Når der så på et tidspunkt tastes en adresse ind på enheden, lægges der ud fra adressen en cookie på enheden, der definerer den som tilhørende F3, G3 eller en af de andre typer i klassifikationen.

– Når først vi har etableret en kobling mellem enhed og klassifikation, følger vi med i, hvad eksempelvis denne F3’er foretager sig på nettet. Koblingen mellem adresse og enhed forsvinder i samme øjeblik, vi har lagt en ”F3-cookie” på enheden, fortæller Martin K. Glarvig.

Han understreger, at Geomatic holder sig fuldstændig inden for lovens rammer, hvilket blandt andet betyder, at man ikke lagrer personhenførbar information.

– Overordnet set handler det om at forstå samfundet gennem data og derigennem være med til at understøtte en god og positiv udvikling. Der hviler et stort ansvar på de enkelte aktører i branchen, at de opfører sig ordentligt, og vi ser os i den sammenhæng faktisk som en slags foregangsmænd, siger han.

Privacy rykker sig

Hvad angår problemstillinger i forhold til privacy, ser Martin K. Glarvig en tydelig tendens til, at grænsen for, hvad der betragtes som privat, hele tiden rykker sig – ikke mindst blandt de unge. Han er ikke generelt bekymret for beskyttelsen af borgernes privacy, men kan dog blive det, hvis nogle udnytter eksempelvis cookie-direktivet ud over det tilladte. Det sker for eksempel, hvis man i bannerreklamer får tilbudt rejser i præcis den uge og til præcis den destination, som man netop har søgt på på en anden aktørs side. Her er der lagret og videreanvendt persondata til en målrettet reklame over for en specifik person, og det er ulovligt. Derimod er det lovligt at registrere, at personen generelt er interesseret i skirejser eller modetøj.


Læs også...

En gruppe IT-undervisere har lavet seks nye spil, der skal øge danskernes viden om cybersikkerhed. Spillene er et nyt og underholdende værktøj, der…

Forskere går sammen med erhvervslivet om et nyt center, der skal understøtte fabrikation af mikrochips i Danmark. Det nye center ligger på DTU, og det…

Som de fleste forhåbentlig ved, så må din arbejdsgiver ikke spørge ind til, hvad du fejler, når du melder dig syg. Men hvis du selv fortæller det,…

Et forsøg hos Google betyder, at fagforeninger ikke dukker op i en række brugeres søgeresultater. Situationen rejser kritik både på Christiansborg og…

Hver dag logger 100 millioner brugere ind på det sociale medie Threads. Mediet er en del af Meta, og det blev lanceret i 2023.

En ny form for IT-uddannelse åbner op for, at flere kan blive softwareingeniører. Næste år kan man nemlig søge ind på en trainee-uddannelse hos VIA…

Google tager syvmileskridt mod kvantecomputeren med chippen Willow, TikTok forurener ifølge undersøgelse mest af sociale medier – lige så meget som…

Hvordan er magthierarkiet i det danske tech-miljø? Det forsøger en ny analyse at give svaret på – og umiddelbart er det ikke tekniske profiler, der…

Nye principper skal sikre, at vi ikke lægger hele vores fremtid i hænderne på tech-giganterne. "Tech-giganterne har primært fokus på teknologiske…

Kommunerne har ikke ressourcer nok, når det gælder IT-sikkerhed, og derfor er de uhyre sårbare. Det viser en ny analyse, som ifølge professor i…