Balladen om Facebook-data og psykologisk profilering

Hvis du gerne vil foretage psykologisk profilering af en bestemt målgruppe, så er Facebook ikke et dårligt sted at starte. 

En artikel i den britiske avis The Guardian fra 11. december 2015 beskriver, hvordan Dr. Aleksandr Kogan fra Institut for Psykologi på University of Cambridge høstede data fra millioner af Facebook-brugere, som han solgte til Cambridge Analyticas moderselskab, Strategic Communications Laboratories (SCL). De høstede Facebook-data blev ifølge The Guardian anvendt til psykologisk vælgerprofilering af Ted Cruz-kampagnen. 

Data fra 50 millioner amerikanere

Prosabladet finder frem til Dr. Aleksandr Kogan, som siden har skiftet efternavn til Spectre, fordi han er blevet gift. Han bor nu i San Francisco i stedet for Cambridge i England, men han er stadig tilknyttet Institut for Psykologi på Cambridge-universitetet som forsker. Han ønsker ikke at kommentere samarbejdet med SCL, da han har indgået en fortrolighedsaftale med SCL, men han betegner store dele af Guardian-artiklen som ukorrekt. Han understreger også, at indsamlingen af Facebook-data foregik i regi af hans selskab Global Science Research (GSR) og dermed intet havde med University of Cambridge at gøre. GSR er ikke længere et aktivt firma.

Selvom dataindsamlingen altså ifølge Dr. Spectre ikke havde noget med universitetet i Cambridge at gøre, så kan man læse følgende på den ph.d.-studerende Matthew Samsons profil på Institut for Psykologis website:  

”Jeg har adgang til Facebook og personlighedsinformation fra 50 millioner amerikanere.”

Dr. Spectre medgiver, at han via sin virksomhed GSR gav data til Institut for Psykologi for at hjælpe sine studerende. 

– De data, som laboratoriet havde, var indsamlet af GSR via en app, som vi havde udviklet, og hvor vi brugte Facebook-API'et. Du laver en app og suger data ind. GSR gav de data til universitetet. Jeg kan ikke huske antallet, det er tre år siden, men 50 millioner lyder sandsynligt.

Facebook reagerer

Ifølge The Guardian blev brugere på crowdsourcing-markedspladsen Mechanical Turk betalt en dollar for at udfylde et spørgeskema og give adgang til deres Facebook-data. Men ikke nok med det: Hvis en Mechanical Turk-bruger accepterede tilbuddet, ville brugerens Facebook-venners data også blive høstet. Facebook reagerede vredt på Guardian-artiklen, om at Facebook-brugere blev franarret deres informationer med følgende kommentar: ”At narre folk eller misbruge deres information er i strid med vores politik, og vi vil reagere hurtigt over for firmaer, som gør det, inklusive bandlysning på Facebook og krav om, at uretmæssigt indsamlede data slettes.”

Dr. Spectre holder dog fast i, at han ikke har anvendt fordækte metoder til at indsamle data. 

– Hele afsnittet om Mechanical Turk er fundamentalt forkert, siger Dr. Aleksandr Spectre om Guardian-artiklen. Han har via sit arbejde på Cambridge-universitetet benyttet sig af Mechanical Turk, men ikke i forbindelse med den pågældende høst af Facebook-data.

– Mit laboratorium har lavet forskning, hvor vi har benyttet Mechanical Turk og Facebook, men til GSR-projektet anvendte vi et firma kaldet Qualtrics.

Qualtrics er et globalt firma med hovedkvarter i Utah, USA, der blandt andet indsamler og analyserer online-data. Dr. Spectre forklarer, at han udviklede en app, som basalt set var en login-side, og Qualtrics stod så for at distribuere og indsamle data via appen.

Da Prosabladet kontakter Qualtrics for at høre, hvad det egentlig koster at få dem til at kontakte 50 millioner amerikanere, står det hurtigt klart, at det ikke er noget, som Cambridge-forskere eller for den sags skyld mange virksomheder har råd til: Prisen er 250 millioner dollars, eller fem dollars pr. person.

Prosabladet kontakter derfor Dr. Spectre igen for at høre, hvordan han via Qualtrics fik fat i 50 millioner amerikaneres Facebook-data.

– Vi rekrutterede 200.000 folk, ikke 50 millioner. De 50 millioner var venner af de 200.000, lyder svaret pr. mail.

Facebook-API'et tillod på det tidspunkt, at udviklere indsamlede data om Facebook-brugeren, som autoriserede appen, samt Facebook-brugerens venner. Dr. Spectre understreger, at de indsamlede data fra Facebook-brugernes venner skulle være ”relativt offentlige”, så enhver Facebook-ven kunne se dem, som det eksempelvis er tilfældet med page-likes. Desuden kunne Facebook-brugernes venner have undgået at dele deres data, hvis de havde ændret i deres privacy-indstillinger. Det var der øjensynlig 49,8 millioner Facebook-brugere, der ikke havde gjort. 

Samarbejdet, som ikke var

Med en pris på fem dollars pr. amerikaner kontaktet af Qualtrics har det altså kostet en million dollars at indsamle Facebook-data om 50 millioner amerikanere. Hvad SCL betalte GSR for de indsamlede data, er fortroligt, men det må være mere end en million dollars. Ellers ville det være en underskudsforretning for GSR. 

Det er ikke lykkedes for Prosabladet at finde ud af, om der blandt de 50 millioner brugere også er ikke-amerikanere, men det er meget sandsynligt, at nogle af de 200.000 amerikanske Facebook-brugere også havde ikke-amerikanere blandt deres Facebook-venner.  

Hvem der i dag har adgang til de indsamlede data, er heller ikke helt klart. Ph.d.-kandidaten Matthew Samson fra Institut for Psykologi på University of Cambridge har dem angiveligt ikke længere. 

”...[en] avis publicerede en artikel, som sagde, at hans laboratoriums teknologi blev brugt af den republikanske præsidentkandidat Ted Cruz til at identificere potentielle vælgere. Konsekvensen blev, at Matts laboratorium mistede sit samarbejde med Facebook, og han blev nødt til at slette al sin forskning og gå tilbage til tegnebrættet”, som det hedder i et portræt af Matthew Samson på GatesCambridge, som er et website for Bill Gates' Cambridge Scholarship-program.

Ifølge Dr. Aleksandr Spectre passer det dog ikke, at Facebook opsagde samarbejdet med Institut for Psykologi. 

– Det er forkert. Det er en klodset formulering. Appen, vi udviklede, anvendte det offentligt tilgængelige Facebook-API, så et samarbejde med Facebook var ikke nødvendigt, siger Aleksandr Spectre. Han ønskede at beskytte sin ph.d.-studerende mod dårlig presseomtale og besluttede derfor at undlade at bruge de indsamlede data i forskningen.

Om der er andre organisationer, der anvender de 50 millioner amerikaneres Facebook-data til diverse profileringsformål, vides ikke med sikkerhed. Men mon ikke Cambridge Analyticas moderselskab, SCL, har forsøgt at få lidt værdi ud af de mere end en million dollars, som de højst sandsynligt betalte for de indsamlede data?  


Læs også...

De store blev rigere og mere magtfulde, men nedenunder brød et oprør også igennem fra lovgivere og bekymrede borgere. "Brainrot" blev årets ord i…

Måske har Microsoft knækket koden til, at vi kan få AI lokalt i smartdevices. I dag er strømforbruget alt, alt for massivt. Tilsæt optiske chips, og…

En gruppe IT-undervisere har lavet seks nye spil, der skal øge danskernes viden om cybersikkerhed. Spillene er et nyt og underholdende værktøj, der…

Forskere går sammen med erhvervslivet om et nyt center, der skal understøtte fabrikation af mikrochips i Danmark. Det nye center ligger på DTU, og det…

Som de fleste forhåbentlig ved, så må din arbejdsgiver ikke spørge ind til, hvad du fejler, når du melder dig syg. Men hvis du selv fortæller det,…

Et forsøg hos Google betyder, at fagforeninger ikke dukker op i en række brugeres søgeresultater. Situationen rejser kritik både på Christiansborg og…

Hver dag logger 100 millioner brugere ind på det sociale medie Threads. Mediet er en del af Meta, og det blev lanceret i 2023.

En ny form for IT-uddannelse åbner op for, at flere kan blive softwareingeniører. Næste år kan man nemlig søge ind på en trainee-uddannelse hos VIA…

Google tager syvmileskridt mod kvantecomputeren med chippen Willow, TikTok forurener ifølge undersøgelse mest af sociale medier – lige så meget som…

Hvordan er magthierarkiet i det danske tech-miljø? Det forsøger en ny analyse at give svaret på – og umiddelbart er det ikke tekniske profiler, der…