Google повертає суперечливий інструмент генерації зображень ШІ після негативної реакції

Google AI вирішив повернути інструмент створення зображень людини, який раніше був відключений через створення історично неточних зображень.

Google представив оновлення для своєї моделі Imagen 3 у дописі в блозі в середу. Модель була вперше випущена в травні, і в останній версії незабаром почнуть створювати зображення людей для клієнтів Gemini Advanced, Business і Enterprise.

«Компанія оголосила, що в наступні дні вони почнуть запроваджувати створення зображень осіб для своїх користувачів Gemini Advanced, Business і Enterprise, спочатку англійською мовою з попередньою версією».

«Imagen 3 дозволив нам досягти значних успіхів у покращенні взаємодії з користувачем під час створення зображень людей».

Google нагадав користувачам, що станом на серпень 2024 року генератор зображень штучного інтелекту не здатний створювати фотореалістичні зображення впізнаваних осіб, зображення неповнолітніх або графічні та відверті сцени насильства чи сексуальності.

Кіберрука на синьому фоні з логотипом Google над нею
Pexels, Google

У заяві чітко зазначено, що Google має намір запобігти створенню спірних зображень. Компанія уточнила, що їх обмеження на «індивідуалів» також стосується конкретних пошукових запитів, які можуть призвести до зображень видатних діячів.

У відповідь на скарги щодо фактично та історично неточних зображень Google відключив створення зображень людини в Gemini ще в лютому. Критика була спрямована на те, що Близнюки зображують певних осіб, у тому числі батьків-засновників США та групи, такі як німецькі солдати часів нацизму, як кольорових людей.

Деякі люди також висловили невдоволення тим фактом, що Близнюки не генерують зображення людей різних етнічних груп. Наприклад, один користувач спробував створити зображення «біляволосої, блакитноокою скандинавської жінки», але натомість отримав від Gemini зображення «індіанської жінки з фарбованим волоссям».

Тоді Google вибачився за те, що назвав «помилками в певних репродукціях історичних зображень», зроблених Gemini. Компанія заявила, що спроби інструменту ШІ створювати різноманітні зображення не виправдали очікувань.

Незабаром після того, як Ілон Маск придбав X, було реалізовано оновлення генерації зображень. Це було на додаток до функції, подібної до Grok, яка була включена в придбання. Крім того, Midjourney зробив свій генератор зображень доступним для осіб без облікових записів Discord. Хоча стабільна дифузія все ще є життєздатним варіантом для створення локальних зображень, вона вимагає певного рівня відданості.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *