Сегодня я бросил вызов знаменитому нейронному генератору изображений. Участники – Flux, Ideogram, Gemini, Kling, Runway, ChatGPT, ReCraft, Midjourney и отечественные участники – Shedevroom и Kandinsky.
Prompt придумал хитрый сценарий, чтобы проверить, знакомы ли они с российской действительностью: «Маленький желтый робот-доставщик Яндекса медленно едет по двору типичной панельной девятиэтажки, раскисшему из-за весенней распутицы. Погода пасмурная, асфальт в глубоких выбоинах, в которых отражаются серое небо и голые ветки. На одном из балконов сушится одежда. Стиль: кинематографический реализм, легкий гранж, с акцентом на отражения в лужах и фактуру мокрого асфальта». (иногда используется в английском переводе).
Стандарты следующие:
- Мгновенная точность сопоставления
- Последовательный стиль
- Техническое качество и логика
- Обработка текста
- Общее впечатление и «вау-эффект”
Анализ и сравнение — самая интересная часть процесса тест-драйва. Итак, начнем.
Первый кандидат — Шедевр. Мы все знаем об этой разработке Яндекса, и она, безусловно, соответствует поставленной задаче и…
Генерация шедевров
Прекрасная атмосфера и обстановка, узнаваемые русские люди, сушимое белье (хотя, честно говоря, это немного странно), но главным объектом является какой-то фургон или даже автобус. Результат — атмосфера (лужи впечатляют, отражения реалистичны, голые ветки деревьев весной). О работе с текстом здесь можно сказать немного, почти ничего. Слабый. Я думаю, это С”.
Второй кандидат — идеограммы. В финальном испытании (с котом и дрелью) нейронная сеть уверенно победила.
Генерация из идеографических символов
Идеограмма снова показала себя с лучшей стороны! Здесь мы видим: робота-доставщика (интересная модель), здание, похожее на панельное, балкон, на котором хорошо видно развешенное для просушки белье. Выглядит очень аутентично. Водопой был великолепен, а деревья были зеленее, чем шедевр, но это было приемлемо. Текст четкий и легко читаемый (шрифт виден даже в отражениях). Совсем неплохо!
Теперь пришло время для самой популярной нейронной сети в списке — Midjourney. Этот генератор уже несколько лет занимает первое место в списке, что же он покажет сейчас?
Результаты для Migiorni
Есть желтая машина на колесах, но я не думаю, что это робот-доставщик. На заднем плане был виден легко узнаваемый панельный дом, на балконе справа (или на дереве, я не могу сказать) висело белье. Приглушенное освещение передано идеально, лужи реалистичны, отражения в них выглядят хорошо. Очень реалистично, с великолепной композицией, глубиной резкости и цветокоррекцией. На задней части «Грузовика» имеется четкая надпись, но ее невозможно прочитать. Стилистически это отличный фильм, но в нем есть и разочаровывающие моменты.
Четвертый кандидат — FLUX. У меня сложные отношения с этим генератором: иногда я готова расцеловать его нейроны, а иногда бросаю перчатки в его монитор и вызываю его на дуэль. Но я не знаю, что он будет делать.
FLUX пытался, но…
Автобус был нормальный, но не достоин восхищения. Дом интересный, многоквартирный, но я бы не назвал его пансионатом. Полотна, отражения, ветки, общая атмосфера — все великолепно. Снег слишком сильный. Надпись все еще была на месте, размытая, но все еще читаемая. Я думаю, этот друг способен на большее.
Теперь я передам слово звезде последних недель — генератору от Chatgpt. Он известен своей великолепной типографикой, и ему стоит создать несколько фотореалистичных работ.
Chatgpt показывает свое поколение
Вот это весело! Инвентарь: типичные панельные дома на заднем плане, симпатичные роботы-доставщики, на одном из балконов видна прачечная, полное ощущение пасмурной погоды, деревья без листьев, глубокие лужи с отражениями. Единственное отличие — балкон только один, что необычно для многоквартирного дома. Но, тем не менее, это была победная попытка.
Пятый кандидат — ReCraft. Он имеет свои преимущества и, как известно, способен обрабатывать векторные изображения. Давайте посмотрим вместе!
Попытка переделать
Робот-доставщик здесь слишком похож на дистанционно управляемую машину. За исключением текста, все остальное в порядке: деревья голые, лужи красивые с отражениями, а погода мрачная. Неплохо, но есть нюансы.
Права на шестое поколение были переданы нейронной сети Kling AI. Честно говоря, мой первый опыт работы с ней был не самым лучшим (из-за ее вполне понятных симпатий к азиатам). Однако их видеогенератор довольно мощный. Давайте начнем!
Это было сделано с помощью искусственного интеллекта Клинга
Великолепный красивый дом в Хуанге с комнатой для совещаний и балконом, но без явно видимой прачечной наверху. Лужа на переднем плане передана идеально. Однако вдоль края тропы лежал довольно глубокий снег, больше похожий на конец зимы или начало весны, чем на типичную грязную «слякоть». Но ветки красивые! Конечно, здесь что-то не так с текстом. Итак, на балконе было слишком много снега и недостаточно одежды.
«Великолепная семерка» — это движущая сила «Подиума». Это известное имя в области нейронных сетей; Некоторое время назад они запустили версию 4 своего видеогенератора. Как поведет себя этот ИИ, остается открытым вопросом.
Взлетно-посадочная полоса окрашена вот так.
Текстовая работа неплохая: надписи читабельны и правильно написаны. Атмосфера передана очень хорошо. Были допущены некоторые грубые ошибки: отсутствие балкона (по какой-то причине одежда висела над окнами), мало деревьев (есть несколько веток).
Восемь – Визуальный Электрик. Я сам открыл этот нейрон во время моего последнего Neuro Challenge. Тогда она добилась хороших результатов.
Visual Electric рисует довольно хорошо
О, это интересно! Жаль, что на балконе не было простыней. Все наполнено атмосферой и реализмом. Если присмотреться, можно даже найти текст ценность!
Давайте вернемся на родину и посмотрим, что бы сделал Кандинский. Ну, а почему бы и нет?
«Пфф-ппфф-ппфф…» изображает желтый предмет с колесами. Там была лужа, отражение и голые ветки. Балкона нет, и само здание очень обычное. Он пытался писать, но не смог.
Десять! Мой личный фаворит — Reve AI. Я очень доволен этой нейронной сетью. Жду шедевра!
Рев ИИ
Почти идеально! Роботы, панели — супер. Лужи, белье на балконе — все в порядке. Высокое качество, логичный набор, но немного придирчивы к балкону). Полностью читаемый и правильный текст «Яндекс”.
Так кто же лидер? Очень субъективно, ну и что?
- Рев ИИ
- Чат GPT
- идеограмма
- Видение Электрик
Остальные показали разную степень успешности, но с более резкими отклонениями от заданного.
Это неврозы. Оказывается, можно повесить одежду и без веревки. Даже на соседнем дереве.
#нейровызов #yandexdeliverer #chatgpt #раскрыть #идеограмма #Кандинский #Мастерская #Recraft