Google возвращает спорный инструмент генерации изображений на основе ИИ после негативной реакции

Компания Google AI решила вернуть инструмент генерации изображений человека, который ранее был отключен из-за создания исторически неточных изображений.

Google представила обновление для своей модели Imagen 3 в блоге в среду. Модель была впервые выпущена в мае, а последняя версия вскоре начнет производить изображения людей для клиентов Gemini Advanced, Business и Enterprise.

«Компания объявила, что в ближайшие дни они начнут внедрять функцию создания изображений людей для своих пользователей Gemini Advanced, Business и Enterprise, первоначально на английском языке в предварительной версии».

«Imagen 3 позволил нам добиться существенных успехов в улучшении пользовательского опыта при создании изображений людей».

Google напомнил пользователям, что по состоянию на август 2024 года генератор изображений на основе искусственного интеллекта не способен создавать фотореалистичные изображения узнаваемых лиц, изображений несовершеннолетних или графических и откровенных сцен, содержащих насилие или сексуальные мотивы.

Киберрука на синем фоне с логотипом Google над ней — Pexels, Google

В заявлении четко указано, что Google намерена предотвратить создание спорных изображений. Компания пояснила, что ее ограничение на «идентифицируемые лица» также распространяется на определенные поисковые запросы, которые могут привести к изображениям известных личностей.

В ответ на жалобы на фактически и исторически неточные изображения Google отключил генерацию изображений людей в Gemini еще в феврале. Критика была направлена на изображение Gemini определенных лиц, включая отцов-основателей США и такие группы, как немецкие солдаты нацистской эпохи, как цветных людей.

Некоторые пользователи также выразили недовольство тем, что Gemini не генерирует изображения людей разных национальностей. Например, один пользователь попытался создать изображение «светловолосой, голубоглазой, скандинавской женщины», но вместо этого получил от Gemini изображение «индийской женщины с крашеными волосами».

Google тогда извинилась за то, что она назвала «ошибками в некоторых исторических репродукциях изображений», сделанных Gemini. Компания заявила, что усилия инструмента ИИ по созданию разнообразного массива изображений не оправдали ожиданий.

Вскоре после того, как Илон Маск приобрел X, было внедрено обновление генерации изображений. Это было в дополнение к аналогичной функции Grok, которая была включена в приобретение. Кроме того, Midjourney сделал свой генератор изображений доступным для лиц без учетных записей Discord. Хотя Stable Diffusion по-прежнему является жизнеспособным вариантом для локальной генерации изображений, он требует определенного уровня самоотдачи.