140 caracteres de F * ck, Sh! T e @ss: como juramos no Twitter

Os pesquisadores investigaram as profundezas dos usuários desbocados do Twitter para descobrir quais palavras sujas as pessoas mais tuitam.

Na melhor das hipóteses, o Twitter é um lugar para encontrar notícias de última hora, diálogos atenciosos e vozes inesperadas. Na pior das hipóteses, é um fórum para reações automáticas, trolls e assédio. Em ambos os extremos, como na vida, é provável que haja alguns palavrões ao longo do caminho.

O quanto as pessoas xingam no Twitter? Quem jura e o que eles dizem?

Quatro pesquisadores educados se esforçaram para descobrir, e o papel que eles produziram –Apresentado essa semana na ACM Conference on Computer-Supported Cooperative Work & Social Computing - é um compêndio de linguagem ofensiva que rivaliza o brilho depravado e cheio de palavrões do filme recente O Lobo de Wall Street .




Depois de examinar uma amostra aleatória de um mês de 51 milhões de tweets em inglês de 14 milhões de contas de usuários distintos, eles chegaram à seguinte conclusão: Amaldiçoamos muito no Twitter, onde nosso idioma geralmente é público, até mais do que fazemos na vida real vida. Ainda mais convincente, eles descobriram o contexto subjacente de quando e por que a maldição acontece e quem está amaldiçoando a quem.

É uma fração considerável das palavras que usamos. Em média, um tweet de 13 tweets conterá pelo menos um palavrão, diz Wenbo Wang , um pesquisador PhD da Wright State University que conduziu o estudo. Por causa das redes sociais, as pessoas não se veem. Eles podem dizer coisas que não diriam no mundo físico. Outros estudos descobriram que 0,5 a 0,7% das palavras que dizemos no mundo físico são maldições - no Twitter, os pesquisadores descobriram que a taxa é de 1,15%. Ou como diz o jornal, e como Wang foi educado demais para repetir durante nossa entrevista por telefone:

O palavrão mais popular é foda, que cobre 34,73% de todas as ocorrências de palavrões, seguido por merda (15,04%), bunda (14,48%), puta (10,34%), negro (9,68%), inferno (4,46%) , puta (1,82%), pau (1,67%), mijo (1,53%) e buceta (1,16%).

As descobertas são interessantes para quem usa o Twitter, mas para a equipe, todos afiliados ao Centro de Excelência em Computação habilitada para o conhecimento de Ohio , o artigo se dobrará em um trabalho com implicações sociais mais amplas relacionadas à saúde mental, abuso verbal, assédio online e diferenças de gênero nas comunicações online.


O conteúdo social é extremamente rico, diz o diretor do centro Amit P. Sheth . A questão do xingamento é uma expressão de sentimento e emoção ... é uma questão central de compreensão da linguagem. O centro está trabalhando no desenvolvimento de ferramentas automatizadas que podem sinalizar questões de assédio preocupante nas redes sociais, especialmente no ensino médio e na faculdade, ou podem identificar transtornos depressivos ou disposição para a violência. Criar filtros para crianças nas redes sociais também é outra aplicação potencial.

Claro, o tempo e o contexto são tudo, e nem todos os xingamentos são negativos. Por exemplo, eu f * $% - amo você poderia ser música para os ouvidos do @ destinatário.

Uma tentativa de análise de sentimento, que tem suas limitações, revelou que enquanto as emoções negativas venceram nos tweets de xingamentos, o amor e a brincadeira (dois amigos dizendo você puta) surgiram como sinais reais nos dados. Raiva e tristeza representaram 22% e 17% dos tweets xingando, enquanto 7% pareciam expressar amor. Um em cada quatro de todos os tweets amostrados que foram classificados como raivosos continha palavrões.

Outros insights no papel envolveram tempo, localização, gênero e nível de influência dos tweeters do NSFW. As pessoas praguejam cada vez mais com o passar do dia, atingindo um pico entre 12h e 1h30 antes de dormir, e segundas, terças e quartas-feiras contêm a maioria dos palavrões em relação ao volume dos tweets.

E como na vida real, as pessoas que estão em ambientes mais relaxados como em casa ou em um clube - ao invés do escritório - são mais propensas a praguejar em um tweet, mas as diferenças são menores do que no mundo face a face ( os pesquisadores olharam apenas para tweets geo-localizados para estes). No entanto, estudantes universitários e do ensino médio não têm vergonha de praguejar, mesmo quando estão na escola. Os homens xingam mais do que as mulheres, mas ambos os sexos são mais propensos a xingar quando conversam diretamente no Twitter com alguém do mesmo sexo. Quanto à classificação social, as celebridades no topo 1% da contagem de seguidores no Twitter são tratadas melhor do que os usuários do Twitter com classificação média:

A proporção de maldições entre os tweets recebidos pelo grupo de 1% principal é a mais baixa em todos os grupos de destinatários: esses usuários populares recebem muitas mensagens amigáveis ​​de seus fãs, por exemplo, @Harry Styles siga-me, querida<3, @NiallOfficial I can’t sleep :(

Os pesquisadores dizem que há espaço para melhorar seu sistema de classificação, já que o esforço de até mesmo definir os palavrões não é tão simples quanto parece. Depois de remover o spam, a equipe teve que codificar cada tweet como maldição ou não maldição. Isso significava decidir o que é uma maldição. Para isso, os quatro autores - nenhum dos quais é falante nativo do inglês - compilaram um léxico de palavras ofensivas e pediram a dois alunos de graduação (quem mais?) Para ajudar a resolver ambigüidades. Eles perceberam que gay pode ser usado tanto como calúnia quanto no discurso descritivo comum. O léxico também teve que ser modificado para incluir todos os tipos de variações: por exemplo, a55, @ $$, $ h1t, b! Tch, bi + ch, c0ck, f * ck, l3itch, p * ssy e dik.

Acho que nosso vocabulário aumentou, diz outro dos outros autores, Lu Chen.