Esta IA transforma fotos pixeladas irreconhecíveis em imagens cristalinas

Esta tecnologia de inteligência artificial transforma o Enhance! A TV tropeça na realidade.

Esta IA transforma fotos pixeladas irreconhecíveis em imagens cristalinas

Lembre-se de todas as vezes que você riu quando algum personagem da TV deu um zoom em uma foto e disse: Aprimore! transformando uma bagunça borrada em uma imagem altamente detalhada e nítida? Agora existe um sistema - um programa de escalonamento de imagem movido por inteligência artificial chamado EnhanceNet - isso tornará impossível rir desse tropo do filme, porque agora é uma realidade tecnológica.



Legenda: À esquerda, a imagem original. Os cientistas alimentaram o pássaro pixelizado (centro) no EnhanceNet. O resultado, à direita, parece quase indistinguível do original. [Imagens de origem: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

Basta olhar as imagens acima. Eles não são falsos. O EnhanceNet pode tirar uma foto grosseiramente pixelada de baixa resolução de um pássaro e transformá-la em uma imagem nítida. Ele ainda reproduz a profundidade de campo da câmera da foto original, como você pode ver nos galhos das árvores em primeiro plano.



Seus inventores - Mehdi S. M. Sajjadi, Bernhard Schölkopf e Michael Hirsch no Instituto Max-Planck de Sistemas Inteligentes na Alemanha - classificam seu software como Super-Resolução de Imagem Única por Síntese de Textura Automatizada. Isso é exatamente o que ele faz: escalona fotos de resolução muito baixa, sintetizando texturas que introduzem novos detalhes na imagem de alta resolução resultante. O detalhe sintético torna as imagens resultantes tão realistas que são quase indistinguíveis das fotos reais. Talvez pela primeira vez, a inteligência artificial agora pode recriar a realidade com uma precisão incrível - usando detalhes falsos.



[Imagens de origem: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

De acordo com os inúmeros experimentos descritos nos pesquisadores papel , o resultado alcança um aumento significativo na qualidade da imagem em altas taxas de ampliação. O software cria essas imagens por redes neurais totalmente convolucionais feed-forward em um ambiente de treinamento adversário. Em outras palavras, como outro redes neurais adversárias, um sistema gera resultados enquanto o outro avalia a precisão do resultado.

A tecnologia envergonha os atuais métodos avançados de dimensionamento de fotos. Você pode ver a enorme diferença nesta comparação entre o método mais moderno (PSNR ou relação sinal-ruído de pico) à esquerda e o resultado obtido pelo EnhanceNet à direita:

números de anjo 999



[Imagem: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

O primeiro falcão é comparável ao dimensionamento disponível no Photoshop, o que sempre resulta em imagens superalisadas que inevitavelmente perdem a definição e não passam no teste do olho humano. O aumento na qualidade e nos detalhes no resultado do EnhanceNet é óbvio.

Falando por e-mail, Mehdi S. M. Sajjadi afirma que o algoritmo poderia ser facilmente colocado em um software comercial como o Photoshop. O que é mais interessante é que você pode realmente torná-lo parte do sistema operacional em smartphones, melhorando a qualidade das imagens conforme você aumenta o zoom para evitar borrões em tempo real, diz Sajjadi. Existem aplicativos adicionais para isso, acrescenta:

Desde aumentar a resolução de filmes antigos para qualidade 4K, restaurando fotos antigas de família que ficam muito borradas quando você deseja obter uma impressão grande para aplicações mais gerais, como melhorar a detecção de objetos. Isso é algo que realmente estudamos no jornal. Acontece que usar nosso algoritmo em imagens torna mais fácil para outras redes neurais detectar objetos em imagens, o que tem amplas aplicações, desde a pesquisa de imagens do Google até a detecção de pedestres em carros que dirigem sozinhos.

significado do anjo 3333



Imagine o seguinte: uma rede neural aprimora a imagem, depois outra usa o resultado para detectar objetos. Claro, isso também inclui potencialmente aplicativos de aplicação da lei. Sajjadi me disse que mesmo os detalhes que são reconstruídos não são necessariamente os verdadeiros [. . .] as técnicas podem de fato ser usadas em casos especiais, como reconhecimento de placas de veículos. Isso significa que a polícia não teria que esperar por câmeras de resolução ultra-alta para detectar as pessoas em alta velocidade. Eles poderiam usar essa tecnologia para fazer isso agora.

[Imagens de origem: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

[Imagens de origem: Mehdi S. M. Sajjadi, Bernhard Schölkopf, Michael Hirsch]

Você também pode usar esse sistema, diz Sajjadi, para remover a pixelização de faces que foram pixeladas, como as de fotos anônimas. E embora a face reconstruída não seja necessariamente idêntica à original, uma vez que a maioria das informações foi perdida durante o processo de pixelização [. . .] pode ajudar a identificar alguém. Isso não funcionaria como prova no tribunal, diz ele, mas você poderia identificar pessoas que não conseguia identificar antes.

Essa tecnologia pode representar uma ameaça real à privacidade. Alguém poderia obter o código para isso e treinar uma rede neural para reconstruir uma imagem que antes estava borrada ou pixelada. Se você já fez upload de pornografia amador com rostos pixelados, prepare-se para desmascarar.