O Google lançou seu novo modelo de geração de imagens, chamado Gemini Imagen 3, devido à grande reação pública à versão anterior, que retratava cenas históricas imprecisas, muitas vezes perpetuando estereótipos prejudiciais. Em resposta, o Google interrompeu o recurso no início deste ano e prometeu corrigir os problemas.
O modelo mais recente do Imagen 3 possui qualidade de imagem melhorada, suporte expandido a idiomas e capacidades criativas aprimoradas, gerando imagens de alta qualidade com apenas algumas palavras.
O Imagen 3 também inclui a ferramenta SynthID do Google, que coloca marcas d’água em imagens para indicar que elas são geradas por IA.
No entanto, a empresa reconheceu que o Imagen 3 não está isento de falhas. Ele ainda pode produzir resultados imperfeitos, particularmente em áreas criativas.
Além disso, o Google implementou diretrizes rígidas que proíbem a criação de imagens fotorrealistas, indivíduos identificáveis, representações de menores e cenas excessivamente sangrentas, violentas ou sexuais.
A empresa expressou seu comprometimento com o feedback dos usuários e com a melhoria contínua, garantindo aos usuários que suas contribuições serão inestimáveis para refinar ainda mais os recursos do modelo.
Os novos recursos de geração de imagens estarão inicialmente acessíveis aos usuários do Gemini Advanced, Business e Enterprise, em inglês, estendendo tais recursos - posteriormente - a outros usuários e idiomas.
Além do Imagen 3, o Google também está lançando Gems, versão de chatbots personalizados semelhantes aos GPTs da OpenAI. Esse recurso permite que os usuários criem assistentes de IA personalizados com instruções específicas.
Você pode personalizar Gems para atuar como um especialista em tópicos ou refiná-los em direção aos seus objetivos específicos. Basta escrever instruções para sua Gem, dar um nome e “conversar” com ela sempre que quiser.
Seja tutoria de codificação, estratégia de marketing ou brainstorming de ideias, os Gems podem atuar como especialistas em qualquer tópico.
Sua Gem pode se lembrar de um conjunto detalhado de instruções para ajudá-lo a economizar tempo em tarefas tediosas, repetitivas ou difíceis."
O Google também está introduzindo Gems pré-construídos, que incluem um coach de aprendizagem, um brainstormer, um guia de carreira, um editor de escrita e um parceiro de codificação.
Embora o recurso Gems esteja sendo lançado em desktops e dispositivos móveis, ele está disponível atualmente apenas para assinantes pagos do Gemini Advanced, Business e Enterprise.
Fonte: computing