Balladen om Facebook-data og psykologisk profilering

Hvis du gerne vil foretage psykologisk profilering af en bestemt målgruppe, så er Facebook ikke et dårligt sted at starte. 

En artikel i den britiske avis The Guardian fra 11. december 2015 beskriver, hvordan Dr. Aleksandr Kogan fra Institut for Psykologi på University of Cambridge høstede data fra millioner af Facebook-brugere, som han solgte til Cambridge Analyticas moderselskab, Strategic Communications Laboratories (SCL). De høstede Facebook-data blev ifølge The Guardian anvendt til psykologisk vælgerprofilering af Ted Cruz-kampagnen. 

Data fra 50 millioner amerikanere

Prosabladet finder frem til Dr. Aleksandr Kogan, som siden har skiftet efternavn til Spectre, fordi han er blevet gift. Han bor nu i San Francisco i stedet for Cambridge i England, men han er stadig tilknyttet Institut for Psykologi på Cambridge-universitetet som forsker. Han ønsker ikke at kommentere samarbejdet med SCL, da han har indgået en fortrolighedsaftale med SCL, men han betegner store dele af Guardian-artiklen som ukorrekt. Han understreger også, at indsamlingen af Facebook-data foregik i regi af hans selskab Global Science Research (GSR) og dermed intet havde med University of Cambridge at gøre. GSR er ikke længere et aktivt firma.

Selvom dataindsamlingen altså ifølge Dr. Spectre ikke havde noget med universitetet i Cambridge at gøre, så kan man læse følgende på den ph.d.-studerende Matthew Samsons profil på Institut for Psykologis website:  

”Jeg har adgang til Facebook og personlighedsinformation fra 50 millioner amerikanere.”

Dr. Spectre medgiver, at han via sin virksomhed GSR gav data til Institut for Psykologi for at hjælpe sine studerende. 

– De data, som laboratoriet havde, var indsamlet af GSR via en app, som vi havde udviklet, og hvor vi brugte Facebook-API'et. Du laver en app og suger data ind. GSR gav de data til universitetet. Jeg kan ikke huske antallet, det er tre år siden, men 50 millioner lyder sandsynligt.

Facebook reagerer

Ifølge The Guardian blev brugere på crowdsourcing-markedspladsen Mechanical Turk betalt en dollar for at udfylde et spørgeskema og give adgang til deres Facebook-data. Men ikke nok med det: Hvis en Mechanical Turk-bruger accepterede tilbuddet, ville brugerens Facebook-venners data også blive høstet. Facebook reagerede vredt på Guardian-artiklen, om at Facebook-brugere blev franarret deres informationer med følgende kommentar: ”At narre folk eller misbruge deres information er i strid med vores politik, og vi vil reagere hurtigt over for firmaer, som gør det, inklusive bandlysning på Facebook og krav om, at uretmæssigt indsamlede data slettes.”

Dr. Spectre holder dog fast i, at han ikke har anvendt fordækte metoder til at indsamle data. 

– Hele afsnittet om Mechanical Turk er fundamentalt forkert, siger Dr. Aleksandr Spectre om Guardian-artiklen. Han har via sit arbejde på Cambridge-universitetet benyttet sig af Mechanical Turk, men ikke i forbindelse med den pågældende høst af Facebook-data.

– Mit laboratorium har lavet forskning, hvor vi har benyttet Mechanical Turk og Facebook, men til GSR-projektet anvendte vi et firma kaldet Qualtrics.

Qualtrics er et globalt firma med hovedkvarter i Utah, USA, der blandt andet indsamler og analyserer online-data. Dr. Spectre forklarer, at han udviklede en app, som basalt set var en login-side, og Qualtrics stod så for at distribuere og indsamle data via appen.

Da Prosabladet kontakter Qualtrics for at høre, hvad det egentlig koster at få dem til at kontakte 50 millioner amerikanere, står det hurtigt klart, at det ikke er noget, som Cambridge-forskere eller for den sags skyld mange virksomheder har råd til: Prisen er 250 millioner dollars, eller fem dollars pr. person.

Prosabladet kontakter derfor Dr. Spectre igen for at høre, hvordan han via Qualtrics fik fat i 50 millioner amerikaneres Facebook-data.

– Vi rekrutterede 200.000 folk, ikke 50 millioner. De 50 millioner var venner af de 200.000, lyder svaret pr. mail.

Facebook-API'et tillod på det tidspunkt, at udviklere indsamlede data om Facebook-brugeren, som autoriserede appen, samt Facebook-brugerens venner. Dr. Spectre understreger, at de indsamlede data fra Facebook-brugernes venner skulle være ”relativt offentlige”, så enhver Facebook-ven kunne se dem, som det eksempelvis er tilfældet med page-likes. Desuden kunne Facebook-brugernes venner have undgået at dele deres data, hvis de havde ændret i deres privacy-indstillinger. Det var der øjensynlig 49,8 millioner Facebook-brugere, der ikke havde gjort. 

Samarbejdet, som ikke var

Med en pris på fem dollars pr. amerikaner kontaktet af Qualtrics har det altså kostet en million dollars at indsamle Facebook-data om 50 millioner amerikanere. Hvad SCL betalte GSR for de indsamlede data, er fortroligt, men det må være mere end en million dollars. Ellers ville det være en underskudsforretning for GSR. 

Det er ikke lykkedes for Prosabladet at finde ud af, om der blandt de 50 millioner brugere også er ikke-amerikanere, men det er meget sandsynligt, at nogle af de 200.000 amerikanske Facebook-brugere også havde ikke-amerikanere blandt deres Facebook-venner.  

Hvem der i dag har adgang til de indsamlede data, er heller ikke helt klart. Ph.d.-kandidaten Matthew Samson fra Institut for Psykologi på University of Cambridge har dem angiveligt ikke længere. 

”...[en] avis publicerede en artikel, som sagde, at hans laboratoriums teknologi blev brugt af den republikanske præsidentkandidat Ted Cruz til at identificere potentielle vælgere. Konsekvensen blev, at Matts laboratorium mistede sit samarbejde med Facebook, og han blev nødt til at slette al sin forskning og gå tilbage til tegnebrættet”, som det hedder i et portræt af Matthew Samson på GatesCambridge, som er et website for Bill Gates' Cambridge Scholarship-program.

Ifølge Dr. Aleksandr Spectre passer det dog ikke, at Facebook opsagde samarbejdet med Institut for Psykologi. 

– Det er forkert. Det er en klodset formulering. Appen, vi udviklede, anvendte det offentligt tilgængelige Facebook-API, så et samarbejde med Facebook var ikke nødvendigt, siger Aleksandr Spectre. Han ønskede at beskytte sin ph.d.-studerende mod dårlig presseomtale og besluttede derfor at undlade at bruge de indsamlede data i forskningen.

Om der er andre organisationer, der anvender de 50 millioner amerikaneres Facebook-data til diverse profileringsformål, vides ikke med sikkerhed. Men mon ikke Cambridge Analyticas moderselskab, SCL, har forsøgt at få lidt værdi ud af de mere end en million dollars, som de højst sandsynligt betalte for de indsamlede data?  


Læs også...

På få minutter komponerede Ole Tange en PROSA-slagsang med tekst fra ChatGPT, og med musik, sang, beats og kor fra Udio.com. "Det fungerer, det er…

Natasha Friis Saxberg er en af de mest markante stemmer, når det handler om at sætte dagsordener inden for it og tech herhjemme. Hun er direktør for…

Selvom Anna igen og igen fortalte sine ledere, at den kode, hun og kollegerne arbejdede med, ikke var god nok, blev der ikke lyttet – men der blev…

Dagligt hører vi om nye hackerangreb, og frygten for, at store angreb kan lægge vores samfund ned, bliver mere og mere reel. Nye it-sikkerhedsregler…

I år har 5.187 personer søgt ind på en it-uddannelse via kvote 2. Det er 10 pct. flere end i 2023.

Den to-årige overenskomst for ansatte i staten er endelig forhandlet på plads for de enkelte organisationer. For ansatte på PROSAs overenskomst…

33-årige Ahmed Zewain drømte om at blive astronom eller astrofysiker, men i dag laver han AI-algoritmer. Han er god til matematik – ikke sådan…

Det er en leg at kode for Simon Moe Sørensen – men det er ikke nok, at du laver verdens flotteste kode, hvis du gerne vil være en succesfuld data…

Politisk rådgiver og talnørd hos PROSA, Ole Tange, giver her en hurtigt introduktion til kryptering.

Musk sagsøger ChatGPT, Instagram mest downloadede app, Netcompany-sagen ruller videre, flere får terapi af chatbots, Apple får kæmpebøde fra Vestager,…