Stable Diffusion 2.0 torna possível transformar uma imagem em outra

No último dia 23 ocorreu o lançamento open-source da versão 2.0 do Stable Diffusion, um software capaz de gerar e manipular imagens através de inteligência artificial.

Tal como nas edições anteriores, visando a acessibilidade, os desenvolvedores otimizaram o código para que a carga de trabalho possa ser realizada por uma única placa de vídeo.

A nova versão traz grandes melhorias, vamos conhecer algumas delas:

Treino duro

O algoritmo de inteligência artificial dessa vez foi treinado por um banco de dados chamado LAION-5B, que contém 5 bilhões de imagens e suas respectivas legendas descritivas, que são classificadas em uma pontuação de "estética".

As imagens foram coletadas de mais de 100 diferentes domínios, sendo o Pinterest, o principal, com participação de 8.5% na quantidade total. Dentre os sites utilizados, também temos Wordpress, Blogspot, Flickr e Wikimedia Commons.

Texto-para-imagem remodelado

O Stable Diffusion passou a utilizar um novo algoritmo para interpretar os comandos de texto em imagens chamado OpenCLIP. Ele é capaz de gerar imagens com resolução maior, sem prejuízos. Antes, a resolução recomendada era 512x512 pixels, agora é 768x768 pixels.

Além disso, ele está equipado com um robusto filtro de detecção e remoção de conteúdo adulto.

Aumente a resolução de sua imagem

A nova versão também inclui nativamente uma ferramenta capaz de aumentar a resolução de uma imagem em até quatro vezes. Se combinarmos a imagem-para-texto com o aumento de resolução, podemos gerar imagens com 2048x2048.

Será que se aplicarmos isto na mesma figura várias vezes, podemos aumentar a resolução indefinidamente?

ferramenta para aumentar a resolução de imagens

Transforme uma imagem em outra

A ferramenta para modificar imagens está renovada, agora se chama depth2img e foram acrescentadas ainda mais possibilidades semânticas. Para utiliza-la, é necessário adicionar uma imagem seguida de um comando de texto ordenando as alterações.

Mude partes de uma imagem rapidamente

Foi também incluída uma ferramenta capaz de modificar partes de uma imagem de forma inteligente e rápida através de comandos de texto.

Teste o Stable Diffusion

Por ser gratuito e ter código aberto, o Stable Diffusion rapidamente se tornou uma ferramenta popular e recebeu inúmeras modificações que trazem novas possibilidades.

Você pode conhecer melhor e baixar a ferramenta através do GitHub. Também existem sites que rodam o Stable Diffusion em servidor para você brincar um pouco, mas neste caso, as possibilidades são mais limitadas do que se você instalar em seu computador.

2 curtidas