”Vi vil gerne vide alt om alle, men intet om den enkelte”

Har du lyst til at vide, om du ud fra statistisk sandsynlighed er en F3’er ”Familie med formue og forstand” eller måske en G2’er ”Vise og velstillede veteraner”, så hop ind på Geomatics hjemmeside, og skriv din adresse ind under menupunktet Klassifikation. I nogle tilfælde er den udførlige typebeskrivelse nærmest spot-on, i andre tilfælde må man konstatere, at det her handler om opsummerede data på en større gruppe mennesker, hvor du tydeligvis er atypisk i forhold til dine naboer.

– Vi plejer at sige, at vi gerne vil vide alt om alle, men intet om den enkelte, forklarer Martin K. Glarvig.

Han er direktør og stifter af Geomatic, hvis forretning er geografisk og demografisk analyse baseret på meget store mængder statistisk data. Resultatet bruges til at inddele danskerne i forskellige typer, som kan anvendes til business intelligence og segmenteringsformål.

Mange offentlige kunder

Kunderne er både private virksomheder, der vil målrette deres markedsføring mod specifikke kundesegmenter og offentlige virksomheder, der anvender de forædlede data til deres planlægning. Geomatic har således en tredjedel af de danske kommuner på referencelisten. 

– Ved at anvende vores data kan kommunerne eksempelvis kortlægge den demografiske profil på velfungerende områder i en by, hvilket kan være et meget væsentlig beslutningsgrundlag i forhold til planlægning af nye bydele, fortæller Martin K. Glarvig, som er geodæt af uddannelse og en af pionererne herhjemme, når det gælder om at lave forretning på basis af offentlige data.

I 2001 blev ejendoms- og adressedata lagt ud som åbne data, og han øjnede med det samme nogle muligheder, ikke mindst for forsikringsselskaber, der nu ville kunne graduere deres tariffer ned på meget mindre enheder end blot et postnummer, og for banker, der kunne benytte data til risikovurdering i forbindelse med långivning. I 2002 stiftede han derfor Geomatic, der i dag tæller 36 medarbejdere. 

Det handler om statistik

Martin K. Glarvig understreger gentagne gange, at Geomatic beskæftiger sig med statistik og ikke med at indsamle viden om den enkelte. 

– Det er ulovligt at indsamle og lagre information om enkeltpersoner uden et samtykke, og for vores kunder er det også uinteressant, siger han.

Der findes ikke en standardiseret definition af, hvad statistik er. Så afgrænsningen mellem indsamling af informationer om en gruppe af personer i modsætning til én person er ikke knivskarp. Danmarks Statistik har nogle retningslinjer, som man følger hos Geomatic, men Martin K. Glarvig kunne godt tænke sig nogle generelle regler.

– Det kunne være en god idé med nogle brancheetiske regler på området, eksempelvis hvor stor en gruppe skal være, før vi kan definere det som statistik, siger han.

Datakvaliteten er det vigtigste

Input til dataanalyserne kommer fra en lang række kilder. Geomatic køber stort ind hos Danmarks Statistik og Gallup Indeks Danmark samt abonnerer på en lang række af de offentlige registre som CPR, CVR og BBR. Martin K. Glarvig ser positivt på frikøbet af grunddata i Grunddataprogrammet.

– Frikøbet af offentlige grunddata vil uden tvivl kunne fremme innovationen, da det er blevet meget nemmere at eksperimentere med nye produkter og forretningsområder, men lige nu ser jeg det mest som en omstrukturering i den måde, hvorpå det offentlige håndterer udvekslingen af data internt, siger han.

Sammen med løn er indkøb af data den klart tungeste post på udgiftssiden hos Geomatic, så han hilser velkommen, at nogle data nu bliver gratis. En høj datakvalitet er dog vigtigere, end at data er gratis.

– For en etableret aktør som Geomatic er det ikke afgørende, at visse offentlige data er gratis. Vi er vant til at betale for data, ikke mindst fra Danmarks Statistik, hvis data ikke er frikøbt, siger han og fortsætter:

– Det er meget vigtigere, at man kan stole på data, og der må vi sige, at data i de bagvedliggende offentlige registre, eksempelvis BBR og CVR, i en del tilfælde er uhensigtsmæssige hvis ikke ligefrem fejlbehæftede. Rent faktisk har vi haft stor succes med at vedligeholde vores eget adresseregister, da det for vores kunder kan være afgørende at have en hit rate på tæt på 100 procent på korrekte adresser frem for måske 95 procent fra det offentlige register.

Som eksempler på fejl i BBR nævner Martin K. Glarvig, at i nogle kommuner bor helt op til fem procent af indbyggerne tilsyneladende i bygninger, der ikke er godkendt til beboelse, og der er indrettet børnehaver i driftsbygninger til landbrug. I CVR er der ingen validering på adresser, så man kan oprette et firma, der i forhold til BBR ikke giver mening, for eksempel en større produktionsvirksomhed på tredje sal i et boligbyggeri!

Han vil gerne være med til at højne datakvaliteten i de bagvedliggende registre, men savner en effektiv og nemt tilgængelig mulighed for at melde tilbage til registrene, hvis man finder fejl. I den aktuelle situation, hvor virksomheden selv skal stå for en del af kvalitetssikringen, kunne han faktisk også godt bruge nogle flere medarbejdere i form af dataspecialister og systemudviklere.

Inden for lovens rammer

Ud over data fra offentlige registre og fra Danmarks Statistik er en meget væsentlig datakilde for Geomatic vores adfærd på nettet, som kortlægges via cookies på de enkelte enheder. Man har aftaler med en række websites, hvor Geomatic får lov til at lægge cookies på brugerens enhed, når de kommer forbi sitet. De opsamlede data kan så dels bruges af firmaet bag websitet, dels af Geomatic i virksomhedens klassifikationsarbejde. Data indsamles alene anonymt og følger IAB’s (Interactive Advertising Bureau) internationale branchestandard for indsamling af statistik via cookies - en standard, der inddeler vores interesser og adfærd i 300 generelle kategorier.

Konkret sker følgende: Når man tilgår et website, hvor Geomatic har en aftale, lægges en cookie på enheden. Når der så på et tidspunkt tastes en adresse ind på enheden, lægges der ud fra adressen en cookie på enheden, der definerer den som tilhørende F3, G3 eller en af de andre typer i klassifikationen.

– Når først vi har etableret en kobling mellem enhed og klassifikation, følger vi med i, hvad eksempelvis denne F3’er foretager sig på nettet. Koblingen mellem adresse og enhed forsvinder i samme øjeblik, vi har lagt en ”F3-cookie” på enheden, fortæller Martin K. Glarvig.

Han understreger, at Geomatic holder sig fuldstændig inden for lovens rammer, hvilket blandt andet betyder, at man ikke lagrer personhenførbar information.

– Overordnet set handler det om at forstå samfundet gennem data og derigennem være med til at understøtte en god og positiv udvikling. Der hviler et stort ansvar på de enkelte aktører i branchen, at de opfører sig ordentligt, og vi ser os i den sammenhæng faktisk som en slags foregangsmænd, siger han.

Privacy rykker sig

Hvad angår problemstillinger i forhold til privacy, ser Martin K. Glarvig en tydelig tendens til, at grænsen for, hvad der betragtes som privat, hele tiden rykker sig – ikke mindst blandt de unge. Han er ikke generelt bekymret for beskyttelsen af borgernes privacy, men kan dog blive det, hvis nogle udnytter eksempelvis cookie-direktivet ud over det tilladte. Det sker for eksempel, hvis man i bannerreklamer får tilbudt rejser i præcis den uge og til præcis den destination, som man netop har søgt på på en anden aktørs side. Her er der lagret og videreanvendt persondata til en målrettet reklame over for en specifik person, og det er ulovligt. Derimod er det lovligt at registrere, at personen generelt er interesseret i skirejser eller modetøj.


Læs også...

På få minutter komponerede Ole Tange en PROSA-slagsang med tekst fra ChatGPT, og med musik, sang, beats og kor fra Udio.com. "Det fungerer, det er…

Natasha Friis Saxberg er en af de mest markante stemmer, når det handler om at sætte dagsordener inden for it og tech herhjemme. Hun er direktør for…

Selvom Anna igen og igen fortalte sine ledere, at den kode, hun og kollegerne arbejdede med, ikke var god nok, blev der ikke lyttet – men der blev…

Dagligt hører vi om nye hackerangreb, og frygten for, at store angreb kan lægge vores samfund ned, bliver mere og mere reel. Nye it-sikkerhedsregler…

I år har 5.187 personer søgt ind på en it-uddannelse via kvote 2. Det er 10 pct. flere end i 2023.

Den to-årige overenskomst for ansatte i staten er endelig forhandlet på plads for de enkelte organisationer. For ansatte på PROSAs overenskomst…

33-årige Ahmed Zewain drømte om at blive astronom eller astrofysiker, men i dag laver han AI-algoritmer. Han er god til matematik – ikke sådan…

Det er en leg at kode for Simon Moe Sørensen – men det er ikke nok, at du laver verdens flotteste kode, hvis du gerne vil være en succesfuld data…

Politisk rådgiver og talnørd hos PROSA, Ole Tange, giver her en hurtigt introduktion til kryptering.

Musk sagsøger ChatGPT, Instagram mest downloadede app, Netcompany-sagen ruller videre, flere får terapi af chatbots, Apple får kæmpebøde fra Vestager,…