Google AI ha deciso di ripristinare lo strumento di generazione di immagini umane, precedentemente disattivato a causa della sua produzione di immagini storicamente inaccurate.
Mercoledì Google ha svelato un aggiornamento per il suo modello Imagen 3 in un post sul blog. Il modello è stato rilasciato per la prima volta a maggio e l’ultima versione inizierà presto a produrre immagini di individui per i clienti Gemini Advanced, Business ed Enterprise.
“L’azienda ha annunciato che nei prossimi giorni inizierà a introdurre la creazione di immagini di individui per i propri utenti Gemini Advanced, Business ed Enterprise, inizialmente in inglese con una versione pre-release.”
“Imagen 3 ci ha permesso di fare progressi sostanziali nel migliorare l’esperienza dell’utente durante la creazione di immagini di individui.”
Google ha ricordato agli utenti che, a partire da agosto 2024, il generatore di immagini basato sull’intelligenza artificiale non è in grado di produrre immagini fotorealistiche di individui riconoscibili, rappresentazioni di minori o scene grafiche ed esplicite che coinvolgano violenza o sessualità.
La dichiarazione indica chiaramente che Google intende impedire la creazione di immagini controverse. L’azienda ha spiegato che la sua restrizione sugli “individui identificabili” si applica anche a specifiche query di ricerca che potrebbero generare immagini di personaggi di spicco.
In risposta alle lamentele su immagini fattualmente e storicamente inaccurate, Google ha disabilitato la generazione di immagini umane in Gemini a febbraio. Le critiche erano rivolte alla rappresentazione di alcuni individui, tra cui i Padri Fondatori degli Stati Uniti e gruppi come i soldati tedeschi dell’era nazista, in Gemini come persone di colore.
Alcune persone hanno anche espresso insoddisfazione per il fatto che Gemini non generi immagini di persone di varie etnie. Ad esempio, un utente ha tentato di produrre un’immagine di una “donna scandinava bionda con occhi azzurri”, ma ha invece ricevuto un’immagine di una “donna indiana con i capelli tinti” da Gemini.
Google ha pubblicato delle scuse all’epoca per quelli che ha definito “errori in alcune riproduzioni di immagini storiche” effettuate da Gemini. L’azienda ha dichiarato che gli sforzi dello strumento di intelligenza artificiale per produrre una gamma diversificata di immagini non hanno soddisfatto le aspettative.
Poco dopo che Elon Musk ha acquisito X, è stato implementato l’aggiornamento della generazione di immagini. Questo si è aggiunto a una funzionalità simile a Grok che è stata inclusa nell’acquisizione. Inoltre, Midjourney ha reso il suo generatore di immagini accessibile a individui senza account Discord. Mentre Stable Diffusion è ancora un’opzione praticabile per la generazione di immagini locali, richiede un certo livello di dedizione.
Lascia un commento