Google traz de volta ferramenta controversa de geração de imagens de IA após reação negativa

O Google AI decidiu trazer de volta a ferramenta de geração de imagens humanas que estava desativada anteriormente devido à produção de imagens historicamente imprecisas.

O Google revelou uma atualização para seu modelo Imagen 3 em uma postagem de blog na quarta-feira. O modelo foi lançado pela primeira vez em maio, e a versão mais recente em breve começará a produzir imagens de indivíduos para clientes Gemini Advanced, Business e Enterprise.

“A empresa anunciou que nos próximos dias começará a introduzir a criação de imagens de indivíduos para seus usuários Gemini Advanced, Business e Enterprise, inicialmente em inglês com uma versão de pré-lançamento.”

“O Imagen 3 nos permitiu fazer avanços substanciais na melhoria da experiência do usuário ao criar imagens de indivíduos.”

O Google lembrou aos usuários que o gerador de imagens de IA não é capaz de produzir imagens fotorrealistas de indivíduos reconhecíveis, representações de menores ou cenas gráficas e explícitas envolvendo violência ou sexualidade, a partir de agosto de 2024.

Mão cibernética em fundo azul com logotipo do Google acima dela — Pexels, Google

A declaração indica claramente que o Google pretende impedir a criação de imagens contenciosas. A empresa elaborou que sua restrição a “indivíduos identificáveis” também se aplica a consultas de pesquisa específicas que podem resultar em imagens de figuras proeminentes.

Em resposta a reclamações sobre imagens factual e historicamente imprecisas, o Google desabilitou a geração de imagens humanas no Gemini em fevereiro. As críticas foram direcionadas à representação de certos indivíduos pelo Gemini, incluindo os Pais Fundadores dos EUA e grupos como soldados alemães da era nazista, como pessoas de cor.

Alguns indivíduos também expressaram insatisfação com o fato de que o Gemini não gera imagens de pessoas de várias etnias. Por exemplo, um usuário tentou produzir uma imagem de uma “mulher escandinava de cabelos loiros e olhos azuis”, mas, em vez disso, recebeu uma imagem de uma “mulher indiana com cabelos tingidos” do Gemini.

O Google emitiu um pedido de desculpas na época pelo que chamou de “erros em certas reproduções históricas de imagens” feitas pela Gemini. A empresa declarou que os esforços da ferramenta de IA para produzir uma gama diversificada de imagens ficaram aquém das expectativas.

Pouco depois que Elon Musk adquiriu o X, a atualização de geração de imagens foi implementada. Isso foi um acréscimo a um recurso semelhante ao Grok que foi incluído na aquisição. Além disso, a Midjourney tornou seu gerador de imagens acessível a indivíduos sem contas no Discord. Embora o Stable Diffusion ainda seja uma opção viável para geração de imagens locais, ele requer um certo nível de dedicação.