středa 21. ledna 2015

Twitter: Lež a nenávist zemřou na infarkt

Hlavním zabijákem lidstva jsou oběhová onemocnění. Kouření, nedostatek pohybu, obezita patří mezi jejich notorické spouštěče. Nicméně za poslední léta bylo uděláno mnoho, aby se jejich smrtelnost zmírnila. Na významu tak mohou nabývat „měkčí“ faktory – chronický stres, frustrace a deprese, které rovněž vedou k vysokému tlaku a fyziologickým změnám ústícím v oběhové nemoci. Naopak podporující okolí, „mít rameno, kde se vyplakat“ a smysluplný život mají přesně opačný, uklidňují a ubezpečující efekt.

Problémem je, že nikdo neví, jak významné tyto faktory jsou – informace o vlivu psychické ne/pohody na srdeční onemocnění jsou fragmentované, od lidí navštěvující terapie či odpovídající v dotazníkových šetřeních, která mají omezenou vypovídající hodnotu. Johannes Eichstaedt s kolegy (pdf) se proto zaměřili na slovní analýzu tweetů pocházejících od uživatelů z různých okresů. Předpokládali, že tak dokáží zachytit „duši“ regionu, kterou pak porovnají s údaji o četnosti umírání na srdeční onemocnění tamtéž.

Potvrdili, že čím frekventovaněji uživatelé na Twitteru píší slova spjatá se zlobou a nesnášenlivostí (obvykle vulgarismy), špatnými vztahy („nesnáším“), obecně s negativními emocemi, tím více se v regionu, kde bydlí, umírá na srdeční onemocnění. Slova značící pozitivní emoce („úžasné“, „skvělé“) a zejména zaujetí a smysl („příležitost“, „cíl“) mají opačný efekt, i když ne tak silný. Když odfiltrovali ostatní faktory, které by mohly ovlivnit výsledky (v některých regionech mohou žít chudší, méně vzdělaní obyvatelé, u kterých bude rozšíření nemocí i frustrace větší), závěry vyšly zhruba stejně.
První mapa ukazuje reálné statistiky, jak se v některých okresech USA umírá na oběhová onemocnění (percentily), druhá mapa ukazuje předpověď úmrtnosti založenou jen na datech z Twiterru. Jak patrno, odhad je velmi přesný.
I když lze studii vytknout, že výsledky mohou být taženy jinými proměnnými (třeba nezaměstnaností v regionu, různým věkem uživatelů, atp.), analýza slov z Twitteru dokáže předpovídat úmrtnost lépe než standardní faktory jako příjem, vzdělání, nezdravý životní styl či rasa. Mimochodem, slovo „milovat“ se častěji pojilo s věcmi než s lidmi.


Psáno pro Vesmír.

Žádné komentáře:

Okomentovat