Что такое ImageFX
ImageFX является частью AI Test Kitchen — постоянно развивающейся платформы бета-тестирования Google для экспериментов с ИИ. Новая нейросеть предназначена для генерации изображений по текстовому описанию и основана на диффузионной модели Imagen 2.
Компания делает акцент на том, что в последнем обновлении алгоритмы значительно улучшили, и теперь на выходе получаются качественные и реалистичные иллюстрации с минимумом визуальных артефактов в проработке человеческих лиц и рук.
Использовать ImageFX можно как внутри чат-бота Gemini (бывший Bard), так и отдельно на странице проекта в AI Test Kitchen.
Что умеет ImageFX
По аналогии с Midjourney, Stable Diffusion, DALL-E и другими нейросетями формата text to image ImageFX создаёт изображения по заданному в промпте описанию содержимого, стиля и другим деталям. Разработка Google неплохо справляется с разноплановым контентом от абстрактных сюжетов до фотореалистичных портретов людей.
Отличительная особенность нейросети — в простом интерфейсе и процессе работы в целом, а также в удобной модификации переменных промптов через выпадающие меню. Буквально в пару кликов можно как подправить удачную картинку, изменив тот или иной элемент, так и полностью переработать концепцию.
Полученные изображения подойдут для использования в самых различных целях. Например, для иллюстрирования публикаций в соцсетях, подготовки презентаций, а также учебных и маркетинговых материалах.
Как пользоваться ImageFX
Регистрация
Для использования ImageFX нужно лишь перейти на страницу AI Test Kitchen и залогиниться через Google-аккаунт, нажав кнопку внизу и справа вверху. Однако на данный момент сервис доступен лишь в США, Кении, Новой Зеландии и Австралии. Правда, ограничение действует только в момент регистрации.
Интерфейс и добавление промпта
Большим плюсом ImageFX является максимальная простота. В левой части расположено окошко, куда следует ввести промпт. Вы можете воспользоваться случайным запросом, который предлагает нейросеть, нажав Tab, или ввести свой. Обработка не мгновенная, но и не слишком долгая: примерно 15–25 секунд.
После нажатия Generate в правой части появятся сгенерированные изображения, которые можно просмотреть в виде сетки и более крупных плиток. Смена режима осуществляется кнопками сверху, стрелки же отвечают за переключение между наборами, созданными в одной сессии.
Запросы на русском нейросеть понимает, но довольно плохо — учитывается лишь малая часть условий из промпта, тогда как остальные интерпретируются неверно или просто игнорируются. Лучше использовать английский, хотя бы через переводчик.
Настройка
ImageFX автоматически распознаёт первичный промпт и превращает отдельные слова из него в переменные, подсвеченные фиолетовым. При нажатии на каждое будет появляться выпадающее меню, благодаря чему можно быстро изменять запрос и тонко настраивать общую концепцию. Внизу отображаются предложения, касающиеся стиля и деталей изображения, которые можно включить в промпт. Они, кстати, тоже являются переменными. Повторное нажатие на Generate создаст пачку новых картинок с учётом внесённых изменений.
Многообещающая кнопка настроек скрывает лишь одну опцию — значение seed, которое нейросеть берёт за некую случайную отправную точку при первичной генерации. По умолчанию оно разблокировано, чтобы результы были разнообразнее. Если вам понравилось определённое изображение — нажмите на замочек, и тогда ImageFX будет выдавать что-то похожее. Значение также можно скопировать и добавить в любой промпт как «seed 577941».
Скачивание и обмен
Когда результат вас удовлетворит, скачайте любое изображение в один клик, просто нажав Download.
Также картинкой легко поделиться с помощью кнопки Share. Изображение откроется в новой вкладке, где можно скопировать ссылку на него и, перевернув карточку кликом по кнопке со стрелками, просмотреть промпт и seed. Но самое главное: человек, с которым вы поделитесь ссылкой, сможет нажать Remix и отредактировать копию изображения по своему усмотрению.
Примеры работы
Вот несколько изображений от ImageFX по различным запросам: наглядно оцените возможности нейросети от Google.
Каковы недостатки ImageFX
Как и все генеративные нейросети, ImageFX имеет определённые ограничения. Нельзя создавать изображения откровенного и оскорбительного характера, а также со знаменитостями. Готовые иллюстрации не содержат видимых водяных знаков, но маркируются специальными метками SynthID. Они обозначают контент как созданный ИИ и будут соответственно помечены, если, к примеру, появятся в выдаче Google.
К недостаткам ImageFX также можно отнести отсутствие функции дорисовки внутри или снаружи холста и повышения разрешения (апскейла). Не всегда нейросеть генерирует по четыре картинки, иногда их может быть три, а то и одна. А ещё все изображения имеют соотношение сторон 1 : 1, разрешение 1 536 × 1 536 и формат JPEG.
Также в целях обеспечения доступности для всех пользователей существует суточный лимит на количество запросов. Google не указывает точное количество, но это десятки генераций. По примерной оценке где-то 30–40 промптов.
Сколько это стоит
ImageFX полностью бесплатен через AI Test Kitchen. В составе Gemini стоимость инструмента зависит от тарифного плана. Google нигде не указывает подробности коммерческого использования изображений, но для личных проектов нейросеть можно применять без опаски.