O Google AI decidiu trazer de volta a ferramenta de geração de imagens humanas que estava desativada anteriormente devido à produção de imagens historicamente imprecisas.
O Google revelou uma atualização para seu modelo Imagen 3 em uma postagem de blog na quarta-feira. O modelo foi lançado pela primeira vez em maio, e a versão mais recente em breve começará a produzir imagens de indivíduos para clientes Gemini Advanced, Business e Enterprise.
“A empresa anunciou que nos próximos dias começará a introduzir a criação de imagens de indivíduos para seus usuários Gemini Advanced, Business e Enterprise, inicialmente em inglês com uma versão de pré-lançamento.”
“O Imagen 3 nos permitiu fazer avanços substanciais na melhoria da experiência do usuário ao criar imagens de indivíduos.”
O Google lembrou aos usuários que o gerador de imagens de IA não é capaz de produzir imagens fotorrealistas de indivíduos reconhecíveis, representações de menores ou cenas gráficas e explícitas envolvendo violência ou sexualidade, a partir de agosto de 2024.
A declaração indica claramente que o Google pretende impedir a criação de imagens contenciosas. A empresa elaborou que sua restrição a “indivíduos identificáveis” também se aplica a consultas de pesquisa específicas que podem resultar em imagens de figuras proeminentes.
Em resposta a reclamações sobre imagens factual e historicamente imprecisas, o Google desabilitou a geração de imagens humanas no Gemini em fevereiro. As críticas foram direcionadas à representação de certos indivíduos pelo Gemini, incluindo os Pais Fundadores dos EUA e grupos como soldados alemães da era nazista, como pessoas de cor.
Alguns indivíduos também expressaram insatisfação com o fato de que o Gemini não gera imagens de pessoas de várias etnias. Por exemplo, um usuário tentou produzir uma imagem de uma “mulher escandinava de cabelos loiros e olhos azuis”, mas, em vez disso, recebeu uma imagem de uma “mulher indiana com cabelos tingidos” do Gemini.
O Google emitiu um pedido de desculpas na época pelo que chamou de “erros em certas reproduções históricas de imagens” feitas pela Gemini. A empresa declarou que os esforços da ferramenta de IA para produzir uma gama diversificada de imagens ficaram aquém das expectativas.
Pouco depois que Elon Musk adquiriu o X, a atualização de geração de imagens foi implementada. Isso foi um acréscimo a um recurso semelhante ao Grok que foi incluído na aquisição. Além disso, a Midjourney tornou seu gerador de imagens acessível a indivíduos sem contas no Discord. Embora o Stable Diffusion ainda seja uma opção viável para geração de imagens locais, ele requer um certo nível de dedicação.
Deixe um comentário