Apagando a história: a exclusão de vídeos da guerra na Síria no YouTube preocupa grupos de direitos humanos

Milhares de vídeos, alguns dos quais oferecem evidências cruciais de crimes de guerra, foram excluídos por meio dos algoritmos da plataforma.

Apagando a história: a exclusão de vídeos da guerra na Síria no YouTube preocupa grupos de direitos humanos

A guerra civil na Síria continua mergulhando em novas profundezas de crueldade inimaginável. Em 18 de fevereiro, o regime do presidente sírio Bashar al-Assad lançou um ataque aéreo a Ghouta Oriental, um enclave controlado pela oposição nos arredores de Damasco, onde 400.000 residentes vivem sob um cerco imposto pelo governo desde 2013. Estima-se que 500 civis foram mortos em menos de uma semana .



Muito do que o mundo sabe sobre a situação de Ghouta Oriental vem de residentes que enviam vídeos da área. Em 19 de fevereiro, Eliot Higgins, fundador da Bellingcat e um analista que foi o pioneiro no uso de evidências de código aberto em investigações de conflitos, compilou uma lista de reprodução de vídeos do YouTube feitos no enclave naquele dia . Os vídeos deixam poucas dúvidas quanto aos horrores infligidos à população civil da região. A lista de reprodução de 26 vídeos que Higgins fez no dia seguinte retrata o corpo de uma criança sendo colocado em uma ambulância, pessoas gritando enquanto enfrentam os destroços de edifícios destruídos e jatos de combate mergulhando no céu vazio.

O YouTube hospeda 4 milhões de vídeos relacionados à Síria que foram enviados desde o início da guerra em 2011, de acordo com Keith Hiatt, vice-presidente do programa de direitos humanos da Benetech, uma organização sem fins lucrativos de tecnologia. Mas o YouTube, cujo primeiro vídeo em 2005 retrata um dos cofundadores da empresa em frente a um recinto de elefantes no Zoológico de San Diego, não foi projetado para ser o maior repositório do mundo de imagens de guerra. Durante o verão de 2017, o YouTube introduziu um algoritmo baseado em aprendizado de máquina para sinalizar vídeos por violações relacionadas aos termos de serviço (ToS). O objetivo do algoritmo era agilizar a remoção de vídeos de propaganda que grupos extremistas como o ISIS haviam postado, mas sinalizou um grande volume de conteúdo ativista para remoção também. Em poucos dias, cerca de 900 canais relacionados à Síria, incluindo aqueles administrados por Higgins e Bellingcat, desapareceram da plataforma.



O clamor subsequente levou à cobertura da mídia no New York Times e a Interceptar . Muitos vídeos (incluindo Higgins e Bellingcat) foram eventualmente restaurados e o ritmo das remoções diminuiu. Mas os ativistas dizem que não pararam totalmente. Entre setembro e dezembro, bem depois que o problema atraiu grande atenção da mídia, cerca de 68 canais do YouTube que o armazenamento e curadoria de vídeo da web projetam. Arquivo Sírio foram rastreados foram colocados off-line, compreendendo mais de 400.000 vídeos e elevando o número total de canais excluídos para 216. Outros monitores de direitos humanos notaram que os vídeos continuavam a desaparecer do site no início de 2018. Baixamos vídeos do YouTube e os importamos para nosso sistema , Shabnam Mojtahedi, analista jurídico e estratégico do Centro de Justiça e Responsabilidade da Síria, disse em janeiro, e há momentos em que estou revisando um vídeo e analisando o conteúdo jurídico, e clico em atualizar ou acesse volte dois minutos depois, e estará fora do YouTube.



Desde janeiro, todos, exceto 55 desses 216 canais, foram restaurados. Essa é apenas uma vitória parcial, de acordo com Hadi al-Khatib, fundador e diretor do Arquivo. Ele diz que mais de 200.000 vídeos ainda estão off-line - e são apenas os que sua organização conhece. Devido ao grande volume de vídeos relacionados à Síria atualmente na plataforma e à relutância do YouTube em compartilhar informações sobre as exclusões, o expurgo apagou um número desconhecido de vídeos cuja existência ou exclusão nunca chamou a atenção de quem estava em posição de levantar seu caso com a empresa.

anjo número 1122

Há muito mais canais removidos do que o número que temos, mas o problema é que não os conhecemos, diz Khatib, que acrescentou que alguns canais desaparecerão para sempre, a menos que o YouTube publique um relatório de todos os canais removidos ou nos forneça uma lista deles. Muitas das exclusões foram cíclicas: um exemplo importante é o Sham News, um projeto de jornalismo cidadão responsável por enviar 245.000 vídeos. Khatib diz que o site foi retirado do YouTube e restaurado pelo menos quatro vezes depois que ativistas protestaram contra a empresa. Os canais nem sempre são restaurados por completo e, às vezes, voltam com até 20% de seus vídeos ausentes.

Os ativistas dizem que as exclusões ainda continuam, embora em um ritmo muito mais lento do que no verão. Mesmo com mais de 160 canais voltando, o processo de reintegração de canais está demorando muito, diz Khatib.

o universo de steven acabou?

Como funciona seu algoritmo? O YouTube não te contará



Também está longe de ser claro como o algoritmo do YouTube realmente funciona, quão eficaz ele é ou o que está programado para procurar - a empresa se recusa a compartilhar informações sobre a taxa de erro do algoritmo ou o número total de exclusões do programa para o qual contribuiu. O YouTube também não descreve em detalhes úteis os fatores de aprendizagem que o algoritmo usa para melhorar seu desempenho.

As exclusões em andamento revelam problemas que ativistas e empresas de tecnologia enfrentarão por décadas. Com os governos preocupados com a disseminação online do extremismo e as plataformas de tecnologia temendo serem percebidas como canais de mensagens para intolerantes e terroristas, é provável que a aplicação dos Termos de Serviço (ToS) se torne mais rígida. A introdução de algoritmos de aprendizado de máquina para policiar o conteúdo significa que as empresas agora têm as ferramentas e incentivos para excluir conteúdo em massa, alguns dos quais poderiam ter valor histórico, político, legal ou moral se fossem autorizados a permanecer online .

Por enquanto, a história da guerra civil na Síria ainda está à mercê do YouTube e não se sabe quanto dela já desapareceu. Pense nas imagens do noticiário que foram filmadas nos campos de concentração quando os Aliados os libertaram, diz Hiatt, explicando que essas notícias contemporâneas ainda são cruciais para promover a consciência moderna do Holocausto. Imagine se essa filmagem pertencesse a uma empresa privada que pensasse que não seria uma boa jogada comercial torná-la pública e a excluísse. Essa é a situação em que nos encontramos.

Guerra civil síria é o primeiro conflito no YouTube



O Google, que é a empresa controladora do YouTube, sabe o quão importante foi sua plataforma durante a guerra. A guerra civil na Síria é, em muitos aspectos, o primeiro conflito no YouTube da mesma forma que o Vietnã foi o primeiro conflito na televisão, disse Justin Kosslyn, gerente de produto do Jigsaw, anteriormente chamado de Google Ideas, durante uma entrevista à margem do Fórum da Liberdade de Oslo em setembro. em Nova York, onde Kosslyn acabara de falar. Você tem mais horas de filmagem da guerra civil na Síria no YouTube do que horas da guerra na vida real. Em 2016, a Jigsaw desenvolveu o Montage, um aplicativo semelhante ao Google Docs que permite a análise colaborativa de vídeos online. Kosslyn disse que o projeto foi realizado com investigações relacionadas aos direitos humanos em mente.

O valor dos vídeos do YouTube na Síria é indiscutível, especialmente porque o regime e outros atores armados fecharam grande parte do país para jornalistas e observadores dos direitos humanos. Higgins e seus colegas provaram, sem sombra de dúvida, que as forças de Assad bombardearam um subúrbio de Damasco em agosto de 2013, e uma organização da ONU está agora nos estágios iniciais de avaliação da filmagem do YouTube da Síria para uso futuro em julgamentos de crimes de guerra. Em dezembro de 2016, a Assembleia Geral da ONU votou para estabelecer o Mecanismo Internacional Imparcial e Independente (IIIM) para auxiliar nos processos de crimes de guerra relacionados à Síria. Em conexão com o IIIM, Hiatt e sua equipe da Benetech estão desenvolvendo um software que pode pesquisar e organizar os cerca de 4 milhões de vídeos relacionados ao conflito. O IIIM facilitará o uso dos vídeos no tribunal se os supostos violadores dos direitos humanos forem julgados.

Os vídeos do conflito podem ser críticos em casos em que possam violar os ToS do site - até mesmo os vídeos de propaganda do ISIS ajudam a identificar os membros da organização e explicar suas hierarquias internas. A dificuldade nesse tipo de trabalho é que as informações divulgadas nas redes sociais pelos perpetradores da violência também podem ser usadas para responsabilizar esses perpetradores, observa Mojtahedi.

O YouTube às vezes sugere o quanto o mundo não sabe sobre a guerra. Higgins diz que tem quase certeza de que houve um ataque de gás sarin em Damasco durante o verão de 2017, que passou despercebido. Mesmo investigar um incidente pode levar uma semana de trabalho, mesmo se você tiver duas ou três pessoas, e há cinco ou seis incidentes por dia pelo menos que valem a pena investigar na Síria, diz Higgins.

nome de hienas em rei leão

A solução preferida do YouTube para problemas de ToS relacionados a conflitos é que os remetentes forneçam detalhes contextuais do que seus vídeos retratam, a fim de estabelecer claramente o valor do conteúdo e distingui-lo do material extremista. Mas os vídeos geralmente são o trabalho de pessoas em zonas de guerra que têm acesso limitado à internet, não falam inglês e não sabem os detalhes dos ToS das plataformas da web. É possível que muitos remetentes não tenham mais acesso confiável à Internet ou não estejam vivos para fornecer um novo contexto para seus vídeos - e então há a dificuldade de informar as pessoas em uma zona de guerra sobre as novas diretrizes de ToS ou fazer sete anos de vídeos em conformidade.

Quais agências de notícias precisam voltar ao longo de anos de conteúdo para atualizar tudo e adicionar detalhes a tudo? pergunta Khatib. Isto é impossível. Existem vários casos em que o arquivo sírio não consegue convencer o YouTube a restaurar um canal porque o grupo não consegue entrar em contato com um remetente para informá-lo sobre como adicionar contexto aos padrões ToS do YouTube. Se um remetente for preso ou morto, seu conteúdo corre o risco de ser permanentemente perdido se o YouTube excluí-lo. O YouTube não tem um processo codificado para solicitações de terceiros para restaurar o conteúdo, em vez disso, depende de linhas de comunicação ad hoc com ativistas e analistas. O Syrian Archive também diz que não encontrou uma maneira de baixar mais de 100.000 vídeos por canal fora da plataforma, o que significa que arquivos externos podem preservar apenas uma fração dos vídeos de uploaders vulneráveis ​​de alto volume como o Sham News.

reunião poderia ter sido um e-mail

Por um tempo, grupos de direitos humanos experimentaram construir seus próprios aplicativos, destinados a documentar atrocidades, que estivessem de acordo com as necessidades e experiências das pessoas que viviam a guerra. Mas eles não podiam competir com a popularidade, usabilidade e escala total do YouTube. A comunidade de direitos humanos que trabalha com tecnologia digital entendeu que criar novos aplicativos e canais não faz sentido para ninguém, diz Alexa Koenig, diretora executiva do Centro de Direitos Humanos da Escola de Direito de Berkeley. O YouTube controla esse espaço, e assim o fará em um futuro próximo.

Restrições mais rígidas podem estar a caminho

O YouTube diz que 400 horas de vídeo são enviadas para o site a cada minuto, e novos desenvolvimentos, como o rigoroso novo lei de discurso de ódio nas redes sociais , tornar a remoção de conteúdo extremista especialmente urgente para a empresa. Restrições mais rígidas podem estar a caminho: em 1º de março, a Comissão Europeia emitiu uma recomendação que os sites removem o material terrorista em até uma hora após sua sinalização pelas autoridades policiais. O Google é inevitavelmente responsável perante os acionistas e reguladores - não perante os sírios comuns, que são algumas das pessoas mais impotentes do planeta.

No tipo de aplicação baseada em aprendizado de máquina que o YouTube introduziu no ano passado, um algoritmo cruza rapidamente milhões de vídeos em um banco de dados de hashes ou assinaturas de imagem que indicam o conteúdo de um vídeo. A seguir, fica a cargo da equipe de aplicação das diretrizes do Google, que envolverá cerca de 10.000 pessoas até o final de 2018 , para decidir se esses vídeos devem permanecer on-line ou não. Os ativistas e o YouTube dizem que é apenas em casos muito raros que o algoritmo exclui o conteúdo automaticamente antes que um moderador humano o veja.

Mas ninguém fora do Google sabe o que o algoritmo do YouTube está procurando. Não temos uma lista dos fatores que influenciam a tomada de decisões com o algoritmo, diz Dia Kayyali, um coordenador de defesa da Witness, uma organização sem fins lucrativos dedicada à documentação em vídeo de eventos relacionados aos direitos humanos que está em constante comunicação com o YouTube há mais de as remoções da Síria. Nada disso existe, até onde eu sei. E isso é um problema.

Fast Company perguntou ao YouTube sobre o desempenho do algoritmo, solicitando dados sobre a taxa de erro do programa, o número de vídeos marcados, o número excluído como resultado das sinalizações do algoritmo e sobre como a taxa de sinalizações e exclusões mudou ao longo do tempo. Também perguntamos sobre quais fatores de aprendizagem o algoritmo incorpora para melhorar a si mesmo. A empresa se recusou a entrar em detalhes.

Em junho passado, anunciamos melhorias tecnológicas nas ferramentas que nossos revisores usam na remoção de vídeos e estamos continuando a aprimorá-las, disse o YouTube em um comunicado. Agora, estamos usando o aprendizado de máquina para sinalizar conteúdo de extremismo violento para análise humana. Com o enorme volume de vídeos em nosso site, às vezes fazemos a chamada errada. Quando somos informados de que um vídeo ou canal foi removido por engano, agimos rapidamente para restaurá-lo.

Em 2 de fevereiro, Norah Puckett, advogada sênior da equipe de litígio do Google, fez uma apresentação sobre as práticas de aplicação de ToS da empresa em um Conferência da Universidade de Santa Clara . Ela falou de maneira geral sobre as remoções de ToS, dizendo que em 2016, o YouTube estava recebendo algo como 250.000 sinalizadores por dia e removidos através dos vários meios que aplicamos nossas políticas em algo como mais de 90 milhões de vídeos. Esses números, que antecedem a introdução do algoritmo de aprendizado de máquina, não distinguem entre sinalizadores gerados pelo usuário e humanos e aqueles produzidos por ferramentas automatizadas de aplicação - 250.000 sinalizadores por dia também chegam a 91 milhões por ano, sugerindo um alto correspondência entre sinalizações e remoções.

Sem informações básicas, como você inicia a conversa?

Nate Cardozo, advogado sênior da Electronic Frontier Foundation, acredita que o YouTube não compartilhou informações que poderiam ajudar a analisar de forma significativa o desempenho de seu algoritmo. Tenho certeza de que o Google conhece a taxa de erro, mas nós não. Sem isso, é difícil até mesmo iniciar essa conversa, diz Cardozo. Ele acha que todo o processo de remoção de vídeos é excessivamente opaco. Não sabemos quase nada sobre como essas quedas funcionam. Não sabemos o número total, não sabemos a porcentagem que foi marcada pelo algoritmo em comparação com um humano. . . Não sabemos de nada e, por falar nisso, isso não é exclusivo do YouTube. Isso é quase universal em toda a indústria.

new york ball drop 2020

Os problemas persistiriam mesmo se o algoritmo tivesse uma taxa de erro igual a zero. A guerra civil na Síria é um conflito complexo que envolve dezenas de grupos armados e meia dúzia de militares armados do estado, enquanto os Termos de Serviço do Google são um emaranhado de textos jurídicos que visam equilibrar os interesses corporativos com as demandas regulatórias de um mundo inteiro. Descobrir se um determinado vídeo da Síria viola os ToS de uma determinada empresa de tecnologia seria uma façanha difícil para um ser humano educado realizar. Enquanto os incentivos exigirem a exclusão de mais conteúdo em vez de menos, a aplicação de ToS provavelmente atrairá vídeos de valor potencial. Os algoritmos apenas expandem o escopo e a velocidade do processo.

O Google sabe que hospeda material de imensa importância que ainda ultrapassa os limites de seus ToS. É menos claro que a empresa lutou com a tensão básica entre a aplicação automatizada e a preservação de material relacionado aos direitos humanos e da memória histórica, algo que pode exigir mudanças mais dramáticas do que apenas a restauração de alguns canais excluídos. Eles entendem que há um valor probatório, diz Dia Kayyali, da Witness, sobre os vídeos do YouTube na Síria. Mas isso se traduz para as pessoas que estão escrevendo os algoritmos? Isso se traduz para as pessoas que projetam o aprendizado de máquina? Eu realmente não sei. Meu palpite é que não.