A corrida frenética e sem precedentes para salvar 700.000 NSFW Tumblrs para a posteridade

Os voluntários estão lutando para fazer o download de até 800 terabytes de conteúdo da comunidade com tema adulto do Tumblr antes que desapareça de vista em 17 de dezembro.

A corrida frenética e sem precedentes para salvar 700.000 NSFW Tumblrs para a posteridade

GeoCities, Vine, Friendster - comunidades vivem, prosperam e muitas vezes morrem na rede. Mas o prazo de duas semanas em que o conteúdo desaparecerá do Tumblr não tem precedentes, diz Jason Scott. Ele cofundou Equipe de Arquivo , um projeto voluntário que executa um software que armazena cópias de sites ameaçados de extinção para a posteridade.

Eles agora estão lutando para preservar cerca de 700.000 blogs do Tumblr que devem desaparecer parcial ou totalmente devido a um novo, proibição amplamente definida de conteúdo adulto anunciado em 3 de dezembro. Isso torna a segunda-feira o 17º Dia D, quando imagens, GIFs e vídeos sinalizados como proibidos pela IA do Tumblr irão desaparecer da vista do público - e provavelmente do alcance dos arquivistas.

Normalmente, recebemos um aviso de 30 ou 60 dias ou 90 dias. Quatorze dias é uma loucura, diz Scott. Portanto, provavelmente obteremos apenas uma porcentagem. Francamente, não sei qual é essa porcentagem. Para efeito de comparação, a equipe praticamente terminou de arquivar GeoCities Japan, que não ficará off-line até março de 2019.

Outras pessoas também estão oferecendo ferramentas para preservar esses blogs, mas não na escala industrial do esforço da Equipe de Arquivo - o que pode ainda não ser suficiente.

Scott entrou em ação assim que a proibição de conteúdo do Tumblr foi anunciada, implementando o mecanismo para facilitar o download em massa do material, que começou em 7 de dezembro. Até agora, os voluntários copiaram mais de 40.000 blogs - uma fração do total da plataforma de 12 milhões de blogs - totalizando cerca de 10 terabytes de dados. Scott estima que a quantidade total de conteúdo que pode ser banido está entre 400 e 800 terabytes.

Para participar, os voluntários instalam um programa para Windows, Mac ou Linux chamado ArchiveTeam Warrior , o que torna seu computador parte de uma rede distribuída. Sistemas individuais vasculham sites e encaminham o conteúdo para os servidores da equipe de arquivamento. (O principal voluntário processou cerca de um terabyte de dados entre sábado e terça-feira à tarde, de acordo com o grupo Entre os melhores .)

Muito do material que a equipe de arquivo recolheu ao longo dos anos acaba sendo reproduzido no Máquina Wayback , administrado pela organização sem fins lucrativos Internet Archive em San Francisco. Não há uma relação formal entre os dois grupos, mas uma forte informal: Scott detém o título de arquivista de freerange no Internet Archive - facilitando conexões com indivíduos ou grupos (como Archive Team) que coletaram conteúdo digital para preservação.

Jason Scott [Foto: Dennis van Zuijlekom / Flickr ]

O Internet Archive concordou em receber o conteúdo resgatado do Tumblr. [O Internet Archive é] a instituição que está mais aberta para receber conteúdo arquivado da web, diz Scott. Às vezes o Archive.org diz: ‘Não podemos aceitar isso. Isso é demais. 'Mas é muito raro.

O esforço de Scott é um entre vários para resgatar o conteúdo do Tumblr antes da proibição. O software de aprendizado de máquina mal treinado da empresa controladora do Tumblr, Verizon, sinalizou uma quantidade desconcertante de imagens, GIFs e vídeos como adultos - aparentemente qualquer coisa que seja bege ou contenha formas redondas. No dia 17, esse conteúdo ficará oculto do público, embora não seja excluído dos servidores, afirma o Tumblr. Os usuários também terão a oportunidade de apelar das decisões, as quais a empresa admite que estão sujeitas a erros. (Não comentou sobre projetos de preservação como o da Equipe de Arquivo.)

maçã 4 para 1 divisão

Mas uma grande variedade de blogueiros - de educadores sexuais a aficionados por pornografia e artistas que fazem imagens picantes - sentem que não são mais bem-vindos no Tumblr e é hora de seguir em frente.

Alguns estão construindo sites alternativos, como um chamado Timbr que pode reter e reproduzir um blog do Tumblr inteiro. (Funcionou rápida e quase perfeitamente com um blog do Tumblr antigo e seguro para o trabalho que eu administrava anos atrás.) As pessoas só precisam postar o nome de qualquer blog do Tumblr em um campo do site. O objetivo é fazer com que o Tumblr tenha sido - não um site totalmente pornográfico, mas uma ampla comunidade online que não evita o conteúdo NSFW. Mas os sites voltados para adultos também estão entrando em ação. Um chamado Dark Cloud, por exemplo, também tem um Ferramenta de lenço do Tumblr .

como trabalhar em casa com crianças

Relacionado: Náufragos NSFW do Tumblr estão migrando para esses botes salva-vidas à medida que uma proibição se aproxima


Alguns usuários do Tumblr estão acessando o Twitter ou outros sites com políticas de conteúdo liberais, como Dreamwidth e Travesseiro .

Mas existem muitas desvantagens nesses esforços. A construção de novos sites leva tempo e os modelos de financiamento - doações, associações, anúncios, etc. - em escala não são claros. O Twitter não é realmente um site de comunidade. As contas Dreamwidth são limitadas a 500 MB de armazenamento e Pillowfort está em beta fechado.

E o dia 17 está se aproximando - após o qual Archive Team, Timbr e outros sites não serão mais capazes de acessar o conteúdo adulto oculto. (O criador do Timbr está trabalhando em uma correção que pode permitir que os proprietários transfiram conteúdo após o dia 17.) Os proprietários de blogs ainda podem baixar todo o seu conteúdo após o dia 17, no entanto, usando um recurso integrado do Tumblr que cria um arquivo zip do site. Mas quão útil isso é para pessoas não versadas em tecnologias da web?

As pessoas mais experientes farão coisas como portar seu trabalho para WordPress ou construir algo em um host [web], diz Scott. Mas ele teme que muitas pessoas não estejam preparadas para lidar com o desligamento. Eles realmente não integram totalmente o que tudo isso significa para eles ... Eles não sabem o que fazer a seguir. Além de fazer cópias para colocar na Wayback Machine, ele diz que o Archive Team também pode ajudar as pessoas a restaurar seus blogs em outras plataformas.

Scott está desconfiado da declaração do Tumblr de que nenhum conteúdo será excluído permanentemente (apenas escondido) e que apenas o material visual gráfico, não blogs inteiros, ficará inacessível. A decisão repentina de mudar as diretrizes de conteúdo, o tempo limitado para se adaptar às novas políticas e as falhas no software de marcação de imagens da Verizon não inspiram confiança nos procedimentos do Tumblr entre arquivistas e blogueiros.

Esse é outro motivo pelo qual Scott insistiu tanto, apesar das críticas de alguns de que a Equipe de Arquivo está pegando o conteúdo das pessoas sem sua permissão. Ele é configurando um processo para as pessoas solicitarem que seus blogs sejam removidos da varredura. Nem todos os afetados pela proibição estão entusiasmados com essa abordagem. Eles realmente deveriam ter um opt-in, não um 'ops, talvez nós consigamos retirá-lo se você nos mandar um DM de acordo com esta postagem enterrada em um tópico que as pessoas provavelmente não verão, escreveu um usuário no Twitter.

como ser mais espirituoso

Por enquanto, diz Scott, a equipe de arquivamento está mais focada em salvar o máximo que puder, enquanto ainda pode.