Amerikanske David Robinson er datalog med speciale i dataanalyser. Hans yndlingssprog er R og Python, og normalt er det ikke politiske emner, der præger hans postings på varianceexplained.org. Men han satte sig for at efterprøve en hypotese om den amerikanske præsidentkandidat Donald J. Trump: Når Trump råt fornærmer sin rival, sker det med tweets fra hans egen smartphone, en Samsung Galaxy, som han offentligt har båret ved mange lejligheder. Når han anslår blidere toner og eksempelvis roser de amerikanske OL-deltagere, sker det fra en iPhone. David Robinson satte sig for at se, om der var noget om snakken, så han anvendte et text mining-værkstøj, tidytext R Package, som han selv har været med til at udvikle.
Analyseresultaterne var klare: Tweets fra Trumps Android-telefon og hans kampagnefolks iPhone havde konstaterbart forskellige afsendere. Der er forskel på, hvornår de to kilder tweeter, og brugen af hashtags, links og retweets varierer også. Tekstanalysen afslører, at Android-tweets er vredere og mere negative, mens iPhone-tweets har en overvægt af positive nyheder og anvendelse af billeder. Der er altså tale om en klar forskel på kampagne-tweets og Trumps egne udgydelser, konstaterer forskeren.
David Robinson beretter veloplagt om de metoder, han har anvendt til sin tekstanalyse. Han har offentliggjort sine egenudviklede værktøjer under open source-licens, og i en kommentartråd har flere læsere indsendt forslag til optimering af koden. Det hele kan ses på varianceexplained.org/r/trump-tweets/
kwn