O avanço em tecnologias de inteligência artificial tem permitido a criação de ferramentas para manipulação de imagens, que trazem a sensação de que “o futuro chegou”, como por exemplo, o Stable Diffusion e o Upscaler.
Rembg é mais um desses programas incríveis e sua proposta é remover completamente o fundo de uma foto apenas com alguns comandos de terminal, sem a necessidade de desenhar contornos para recortar em softwares de edição.
O Rembg foi feito em Python sobre um modelo de aprendizado de máquina chamado U²-Net, designado justamente para a detecção de objetos que se salientam em uma imagem. O U²-Net é capaz de lidar com imagens de alta resolução sem aumentar significantemente os custos computacionais e de memória.
Este exemplo demonstra o funcionamento do U²-net.
Como utilizar
A instalação do Rembg é fácil, basta executar o seguinte comando:
pip install rembg
Dessa forma, o processador será utilizado para realizar a tarefa. Se preferir, pode instalar a versão que utiliza GPU:
pip install rembg[gpu]
Você pode remover o fundo de imagens remotas com este comando:
curl -s http://input.png | rembg i > output.png
Imagens locais com este:
rembg i path/to/input.png path/to/output.png
É possível remover o fundo de todas as imagens de uma pasta:
rembg p path/to/input path/to/output
O Rembg também pode ser executado em um servidor e ser disponibilizado como uma ferramenta em seu site, além disso, você pode alimentar a inteligência artificial. Daniel Gatis, o desenvolvedor responsável mostra todo o passo a passo no GitHub.
Resultados
Uma coisa que gostei é que o programa funciona bem até mesmo em meu computador, que é bem simples. Fiz alguns testes em fotos que tirei com meu celular. Em uma das imagens, onde o elemento principal é uma árvore, o recorte ficou impreciso, mas em uma selfie, o resultado foi satisfatório:
Quis ver como ficaria o resultado na thumb do último vídeo do Dio e achei que o contorno do rosto ficou preciso! Apesar de o recorte ter ficado um pouco estranho, destacou os elementos em evidência.
Com um pouco de treino, o usuário acaba entendendo qual tipo de imagem o programa lida melhor, os resultados demonstrados pelo desenvolvedor ficaram bem legais!
Você conhecia esta ferramenta? Mande para a gente o resultado de seus testes!