Foto: Scanpix

Personprofilering: Velkommen til Sandhedsdatabasen

The Database of Truth.

Et helt fantastisk navn på en database, som indeholder persondata og personprofiler tilhørende flere hundrede millioner amerikanere. Sandhedsdatabasen giver offentligheden et unikt indblik i, hvordan personprofiler opbygges ved hjælp af data fra kommercielle og politiske organisationer.

Men det var først, da chefen for Cyber Risk Research hos Upguard, Chris Vickery, gik på uautoriseret opdagelse i analysevirksomheden Aggregate IQ’s kode-lager, at beskrivelserne af Database of Truth dukkede op.

På en intern wiki, som Aggregate IQ-udviklerne anvender til overordnet design og dokumentation af deres systemer, står der, at den primære datakilde for databasen kommer fra RNC Data Trust, der er ansvarlig for vælgerregistreringer for Det Republikanske Parti i USA. De data bliver beriget med andre datakilder:

”Den primære datakilde vil blive kombineret med vælgerregistreringer på statsniveau, forbrugerdata, tredjeparts-dataleverandører, historiske WPA-undersøgelser, projekter og kundedata”, står der i den interne wiki.

WPA refererer til data-analysefirmaet WPA Intelligence, som er et tech-firma med eksperter i offentlig opinion, analyser, adfærdsmæssig videnskab, opinionsundersøgelser og donorresearch.

Personlige data om 198 millioner amerikanere

Chris Vickery, der er selverklæret datalæk-jæger, er i løbet af de sidste par år flere gange stødt på ubeskyttede datasæt indeholdende vælgeres personlige data samt modellerede personkarakteristika som religiøst tilhørsforhold, etnicitet og sandsynligheden for, at vælgeren bakker op om specifikke politiske temaer. Nogle af dem er datakilder til sandhedsdatabasen.

Eksempelvis fandt han et 25 terabytes stort datawarehouse i juni 2017 indeholdende personlige data om 198 millioner amerikanske vælgere. I en ubeskyttet Amazon Web Services Simple Storage Service (AWS S3) lå 1,1 terabytes ukrypterede data med oplysninger som navn, adresse, telefonnumre, fødselsår samt anslået religiøst tilhørsforhold og etnicitet for hver eneste af de 198 millioner amerikanere.

Hver enkelt person er identificeret med et unikt indeks, og i et underbibliotek lå en 50 GB-fil indeholdende sandsynligheden for, at hver enkelt af de 198 millioner amerikanere støtter 46 forskellige politikker. Et decimaltal mellem 0 og 1 indikerer sandsynligheden for, at den enkelte amerikaner eksempelvis er enig i, at der skal investeres i USA’s infrastruktur, eller at en America First-politik er nødvendig.

Det er firmaet Deep Root Analytics, som havde lagt datasættet ukrypteret og ubeskyttet op i AWS S3. De specialiserer sig i ”micro-targeting” ved hjælp af big data.

Præcist hvordan hver enkelt amerikaners sandsynlighed for at støtte de 46 politikker er fremkommet, ved Chris Vickery ikke. Men som det ses af diagrammet, som Chris Vickery har afleveret til den britiske parlamentskomité, der undersøger påstanden om, at Brexit-afstemningen var manipuleret, så leverer firmaer som Axiom Strategies og L2 Political også data og vælgerprofilering til Database of Truth.

Brexit, forsikringsdata og Palantir

Traditionelle marketingfirmaer som Experian, der opdeler befolkningen i forbrugermønstre og segmenter, og forsikringsselskaber kan ligeledes berige personprofilerne i sandhedsdatabasen.

Ved Storbritanniens EU-afstemning blev der angiveligt anvendt forsikringsdata fra forsikringsselskaberne Eldon Finance og Go Skippy, som tilhører forretningsmanden og UKIP-støtten Arron Banks. De blev samkørt med UKIP-medlemsdata og vote.leave-kampagnens data.

Den tidligere Cambridge Analytica-medarbejder Christopher Wylie, der i foråret stod frem som whistleblower, fortalte i sit vidnesbyrd til den britiske parlamentskomité, at big data-analysefirmaet Palantir havde samarbejdet med Cambridge Analytica og haft adgang til de 87 millioner Facebook-brugeres data.

Palantir, der blandt andet leverer det danske politisystem POL-Intel, benægtede først, men da samarbejdet blev dokumenteret ved hjælp af e-mails, ændrede Palantir forklaring til, at det var en enkelt ansat, der på eget initiativ havde taget kontakt med Cambridge Analytica.

Efter afsløringerne har Cambridge Analytica angiveligt mistet stort set alle kunder og drejer efter eget udsagn nøglen om. Men indsamlingen af dine personlige data fortsætter overalt, hvor du sætter dine digitale fodspor.


Læs også...

Ole Tange, it-politisk rådgiver i PROSA, har i denne uge indsendt en klage over Danmarks Radio til Datatilsynet. Det skyldes DRs krav om obligatorisk…

Er du på jagt efter et nyt job i it-branchen? Og er du i tvivl om, hvad virksomhederne især kigger efter? PROSAbladet har spurgt en række…

Fra Baltikums største sciencepark i udkanten af Tallinn sikrer Tehnopol, at hundredvis af startups kommer flyvefærdigt ud i virkeligheden. De får…

Estiske børn og unge får praktisk talt tech ind med modermælken, da it og tech-gadgets er en helt central del af hverdagen i både børnehaver,…

I Estland har borgerne kunne stemme digitalt siden 2005. Der har været kritik og debat, men i dag er det mere end halvdelen af esterne, der bruger…

Hvis man i Estland gerne vil skifte spor i sin karriere, er der en lang række muligheder for at videreuddanne sig inden for it. Skoler og online…

I denne udgave af PROSAbladet har vi lavet et tema-nummer om Estland. Det er sjældent, at vi giver så meget spalteplads til et tema – men det baltiske…

Pulserende krea-værksted klæder estiske børn på med både tech-skills og startup-mentalitet. Der er ingen læreplaner eller kedelige eksamener, men 3D…

Det minder om en blanding af X Factor og Den store bagedyst, og det lægger på 15. år gaderne øde i Estland. Velkommen til tv-talentshowet Rakett69,…

Estland har rykket sig ufattelig langt de seneste 30 år – men hvad skal der ske nu? En af udfordringerne er, at Estland kommer til at mange hænder og…