Foto: Scanpix

Personprofilering: Velkommen til Sandhedsdatabasen

The Database of Truth.

Et helt fantastisk navn på en database, som indeholder persondata og personprofiler tilhørende flere hundrede millioner amerikanere. Sandhedsdatabasen giver offentligheden et unikt indblik i, hvordan personprofiler opbygges ved hjælp af data fra kommercielle og politiske organisationer.

Men det var først, da chefen for Cyber Risk Research hos Upguard, Chris Vickery, gik på uautoriseret opdagelse i analysevirksomheden Aggregate IQ’s kode-lager, at beskrivelserne af Database of Truth dukkede op.

På en intern wiki, som Aggregate IQ-udviklerne anvender til overordnet design og dokumentation af deres systemer, står der, at den primære datakilde for databasen kommer fra RNC Data Trust, der er ansvarlig for vælgerregistreringer for Det Republikanske Parti i USA. De data bliver beriget med andre datakilder:

”Den primære datakilde vil blive kombineret med vælgerregistreringer på statsniveau, forbrugerdata, tredjeparts-dataleverandører, historiske WPA-undersøgelser, projekter og kundedata”, står der i den interne wiki.

WPA refererer til data-analysefirmaet WPA Intelligence, som er et tech-firma med eksperter i offentlig opinion, analyser, adfærdsmæssig videnskab, opinionsundersøgelser og donorresearch.

Personlige data om 198 millioner amerikanere

Chris Vickery, der er selverklæret datalæk-jæger, er i løbet af de sidste par år flere gange stødt på ubeskyttede datasæt indeholdende vælgeres personlige data samt modellerede personkarakteristika som religiøst tilhørsforhold, etnicitet og sandsynligheden for, at vælgeren bakker op om specifikke politiske temaer. Nogle af dem er datakilder til sandhedsdatabasen.

Eksempelvis fandt han et 25 terabytes stort datawarehouse i juni 2017 indeholdende personlige data om 198 millioner amerikanske vælgere. I en ubeskyttet Amazon Web Services Simple Storage Service (AWS S3) lå 1,1 terabytes ukrypterede data med oplysninger som navn, adresse, telefonnumre, fødselsår samt anslået religiøst tilhørsforhold og etnicitet for hver eneste af de 198 millioner amerikanere.

Hver enkelt person er identificeret med et unikt indeks, og i et underbibliotek lå en 50 GB-fil indeholdende sandsynligheden for, at hver enkelt af de 198 millioner amerikanere støtter 46 forskellige politikker. Et decimaltal mellem 0 og 1 indikerer sandsynligheden for, at den enkelte amerikaner eksempelvis er enig i, at der skal investeres i USA’s infrastruktur, eller at en America First-politik er nødvendig.

Det er firmaet Deep Root Analytics, som havde lagt datasættet ukrypteret og ubeskyttet op i AWS S3. De specialiserer sig i ”micro-targeting” ved hjælp af big data.

Præcist hvordan hver enkelt amerikaners sandsynlighed for at støtte de 46 politikker er fremkommet, ved Chris Vickery ikke. Men som det ses af diagrammet, som Chris Vickery har afleveret til den britiske parlamentskomité, der undersøger påstanden om, at Brexit-afstemningen var manipuleret, så leverer firmaer som Axiom Strategies og L2 Political også data og vælgerprofilering til Database of Truth.

Brexit, forsikringsdata og Palantir

Traditionelle marketingfirmaer som Experian, der opdeler befolkningen i forbrugermønstre og segmenter, og forsikringsselskaber kan ligeledes berige personprofilerne i sandhedsdatabasen.

Ved Storbritanniens EU-afstemning blev der angiveligt anvendt forsikringsdata fra forsikringsselskaberne Eldon Finance og Go Skippy, som tilhører forretningsmanden og UKIP-støtten Arron Banks. De blev samkørt med UKIP-medlemsdata og vote.leave-kampagnens data.

Den tidligere Cambridge Analytica-medarbejder Christopher Wylie, der i foråret stod frem som whistleblower, fortalte i sit vidnesbyrd til den britiske parlamentskomité, at big data-analysefirmaet Palantir havde samarbejdet med Cambridge Analytica og haft adgang til de 87 millioner Facebook-brugeres data.

Palantir, der blandt andet leverer det danske politisystem POL-Intel, benægtede først, men da samarbejdet blev dokumenteret ved hjælp af e-mails, ændrede Palantir forklaring til, at det var en enkelt ansat, der på eget initiativ havde taget kontakt med Cambridge Analytica.

Efter afsløringerne har Cambridge Analytica angiveligt mistet stort set alle kunder og drejer efter eget udsagn nøglen om. Men indsamlingen af dine personlige data fortsætter overalt, hvor du sætter dine digitale fodspor.


Læs også...

De store blev rigere og mere magtfulde, men nedenunder brød et oprør også igennem fra lovgivere og bekymrede borgere. "Brainrot" blev årets ord i…

Måske har Microsoft knækket koden til, at vi kan få AI lokalt i smartdevices. I dag er strømforbruget alt, alt for massivt. Tilsæt optiske chips, og…

En gruppe IT-undervisere har lavet seks nye spil, der skal øge danskernes viden om cybersikkerhed. Spillene er et nyt og underholdende værktøj, der…

Forskere går sammen med erhvervslivet om et nyt center, der skal understøtte fabrikation af mikrochips i Danmark. Det nye center ligger på DTU, og det…

Som de fleste forhåbentlig ved, så må din arbejdsgiver ikke spørge ind til, hvad du fejler, når du melder dig syg. Men hvis du selv fortæller det,…

Et forsøg hos Google betyder, at fagforeninger ikke dukker op i en række brugeres søgeresultater. Situationen rejser kritik både på Christiansborg og…

Hver dag logger 100 millioner brugere ind på det sociale medie Threads. Mediet er en del af Meta, og det blev lanceret i 2023.

En ny form for IT-uddannelse åbner op for, at flere kan blive softwareingeniører. Næste år kan man nemlig søge ind på en trainee-uddannelse hos VIA…

Google tager syvmileskridt mod kvantecomputeren med chippen Willow, TikTok forurener ifølge undersøgelse mest af sociale medier – lige så meget som…

Hvordan er magthierarkiet i det danske tech-miljø? Det forsøger en ny analyse at give svaret på – og umiddelbart er det ikke tekniske profiler, der…