Foto: Scanpix

Personprofilering: Velkommen til Sandhedsdatabasen

The Database of Truth.

Et helt fantastisk navn på en database, som indeholder persondata og personprofiler tilhørende flere hundrede millioner amerikanere. Sandhedsdatabasen giver offentligheden et unikt indblik i, hvordan personprofiler opbygges ved hjælp af data fra kommercielle og politiske organisationer.

Men det var først, da chefen for Cyber Risk Research hos Upguard, Chris Vickery, gik på uautoriseret opdagelse i analysevirksomheden Aggregate IQ’s kode-lager, at beskrivelserne af Database of Truth dukkede op.

På en intern wiki, som Aggregate IQ-udviklerne anvender til overordnet design og dokumentation af deres systemer, står der, at den primære datakilde for databasen kommer fra RNC Data Trust, der er ansvarlig for vælgerregistreringer for Det Republikanske Parti i USA. De data bliver beriget med andre datakilder:

”Den primære datakilde vil blive kombineret med vælgerregistreringer på statsniveau, forbrugerdata, tredjeparts-dataleverandører, historiske WPA-undersøgelser, projekter og kundedata”, står der i den interne wiki.

WPA refererer til data-analysefirmaet WPA Intelligence, som er et tech-firma med eksperter i offentlig opinion, analyser, adfærdsmæssig videnskab, opinionsundersøgelser og donorresearch.

Personlige data om 198 millioner amerikanere

Chris Vickery, der er selverklæret datalæk-jæger, er i løbet af de sidste par år flere gange stødt på ubeskyttede datasæt indeholdende vælgeres personlige data samt modellerede personkarakteristika som religiøst tilhørsforhold, etnicitet og sandsynligheden for, at vælgeren bakker op om specifikke politiske temaer. Nogle af dem er datakilder til sandhedsdatabasen.

Eksempelvis fandt han et 25 terabytes stort datawarehouse i juni 2017 indeholdende personlige data om 198 millioner amerikanske vælgere. I en ubeskyttet Amazon Web Services Simple Storage Service (AWS S3) lå 1,1 terabytes ukrypterede data med oplysninger som navn, adresse, telefonnumre, fødselsår samt anslået religiøst tilhørsforhold og etnicitet for hver eneste af de 198 millioner amerikanere.

Hver enkelt person er identificeret med et unikt indeks, og i et underbibliotek lå en 50 GB-fil indeholdende sandsynligheden for, at hver enkelt af de 198 millioner amerikanere støtter 46 forskellige politikker. Et decimaltal mellem 0 og 1 indikerer sandsynligheden for, at den enkelte amerikaner eksempelvis er enig i, at der skal investeres i USA’s infrastruktur, eller at en America First-politik er nødvendig.

Det er firmaet Deep Root Analytics, som havde lagt datasættet ukrypteret og ubeskyttet op i AWS S3. De specialiserer sig i ”micro-targeting” ved hjælp af big data.

Præcist hvordan hver enkelt amerikaners sandsynlighed for at støtte de 46 politikker er fremkommet, ved Chris Vickery ikke. Men som det ses af diagrammet, som Chris Vickery har afleveret til den britiske parlamentskomité, der undersøger påstanden om, at Brexit-afstemningen var manipuleret, så leverer firmaer som Axiom Strategies og L2 Political også data og vælgerprofilering til Database of Truth.

Brexit, forsikringsdata og Palantir

Traditionelle marketingfirmaer som Experian, der opdeler befolkningen i forbrugermønstre og segmenter, og forsikringsselskaber kan ligeledes berige personprofilerne i sandhedsdatabasen.

Ved Storbritanniens EU-afstemning blev der angiveligt anvendt forsikringsdata fra forsikringsselskaberne Eldon Finance og Go Skippy, som tilhører forretningsmanden og UKIP-støtten Arron Banks. De blev samkørt med UKIP-medlemsdata og vote.leave-kampagnens data.

Den tidligere Cambridge Analytica-medarbejder Christopher Wylie, der i foråret stod frem som whistleblower, fortalte i sit vidnesbyrd til den britiske parlamentskomité, at big data-analysefirmaet Palantir havde samarbejdet med Cambridge Analytica og haft adgang til de 87 millioner Facebook-brugeres data.

Palantir, der blandt andet leverer det danske politisystem POL-Intel, benægtede først, men da samarbejdet blev dokumenteret ved hjælp af e-mails, ændrede Palantir forklaring til, at det var en enkelt ansat, der på eget initiativ havde taget kontakt med Cambridge Analytica.

Efter afsløringerne har Cambridge Analytica angiveligt mistet stort set alle kunder og drejer efter eget udsagn nøglen om. Men indsamlingen af dine personlige data fortsætter overalt, hvor du sætter dine digitale fodspor.


Læs også...

Det var en helt ny fornemmelse, da Søren tidligere på året blev ramt af stress, for han havde aldrig oplevet stresssymptomer før. Søren har arbejdet i…

I 1999 havnede Berit Søgaard mere eller mindre tilfældigt i IT-branchen, og hun har arbejdet her lige siden. I dag er hun compliancedirektør i Visma,…

Nettet er proppet til randen med websider, som kan hjælpe dig med det ene eller andet eller har så nørdet viden, at de med fordel kan besøges.

Unge tech-folk fortæller om deres håb og drømme for fremtiden. Danske virksomheder kigger mod et tysk eksporteventyr. Forfatter sætter spot på Kina og…

26-årige Francesca Tremulo rejste til Danmark fra Italien for tre år siden for at realisere drømmen om en fremtid i spilbranchen. Hun er uddannet…

Kinas tech fungerer og er udviklet i benhård konkurrence til at være bedst og billigst. Talentmassen er enorm, og der er prestige og attraktive…

Alberte Viendahl er 25 år og har læst multimediedesign på KEA. Hun er blevet vild med at kode og nørde, og nu vil hun gerne tage en top up-uddannelse…

Benjamin Elias Harris er 27 år, og han har gået på datamatikerlinjen på KEA. Han startede egentlig med at læse engelsk på Københavns Universitet, men…

28-årige Yousra Diab arbejdede i flere år som socialrådgiver, inden hun tog springet og startede på datamatikeruddannelsen. Det har været svært at…

26-årige Sophie Ankjær Andersen har læst multimediedesign på KEA. Hun drømmer om, at hun i fremtiden skal tage sit arbejde med til Bali og arbejde…