У нейросети MidJourney вышла пятая версия. Она гораздо лучше рисует пальцы и руки

27283
2 минуты на чтение
Команда знаменитой нейросети по созданию изображений MidJourney представила пятую версию. Она доступна для тестирования пользователям с платной подпиской.

Компания рассказала про некоторые особенности новой версии. Теперь нейросеть способна создавать изображения более высокого качества, с более широким стилистическим диапазоном. Она поддерживает «бесшовные» текстуры, больше разных форматов, а также лучше понимает «промпты» — текстовые описания в качестве входных данных.

Однако у нейросети есть ещё и несколько неочевидных нововведений.

Первые пользователи, которые поделились своими работами в новой версии, отмечают невероятное качество фотореалистичной графики. Многие отмечают, что MidJourney создаёт сразу четыре картинки в высоком разрешении.

@mondayrunner / Twitter

@mondayrunner / Twitter

@mondayrunner / Twitter

 

Обратите внимание на пальцы. Пользователи почти сразу заметили, что программа стала гораздо лучше справляться с руками и пальцами.

@DblMDblJ / Twitter

@tableauRobot / Twitter

Ещё несколько примеров работ:

@per_arneng / Twitter

Не только люди:
Многие пользователи начали сравнивать одни и те же «промпты» в разных версиях. В случае с цветами слева версия v4, а справа — v5.
Или был такой результат:
Издание Ars Technica приводит ещё сравнение с прошлыми версиями:

V3 / V4 / V5
a muscular barbarian with weapons beside a CRT television set, cinematic, 8K, studio lighting

Свой тест провёл блогер Александр Доброкотов (ведёт сообщество Ai Molodca). Они использовал одинаковые промты в версиях от 1-3 (верхние картинки) и 4-5 (нижние):

85mm f/ 1. 4 Photo portrait of an old man, blue eyes, wearing a dirty yellow leather rain coat, in the style of norwegian fisherman, the old man and the sea, Atmospheric, cinematic lighting, high contrast, 8k, photorealistic

selfie photo of natalie portman and Keira Knightley

vintage photograph of minions storming Normandy, cinematic, grayscale, grain

Вот некоторые выводы Доброкотова:

Что могу сказать.
1. Это лучшая закрытая дифуззионная модель txt-to-img на данный момент.
2. Понимание запроса — великолепно. Исчезло излишнее украшательство прошлой версии. Поэтому короткие промты могут работать хуже.
3. Стилизация — восхитительная.
4. Качество — превосходное. Минимум артефактов и шакалов. Плюс разрешение и скорость генерации. Черрипикинг никогда не был таким простым.
5. Реализм — это новый уровень, даже веха. Можно смело говорить о появлении нейрофотографии.
Кроме того, пользователи отметили, что часть старых «промптов» в нейросеть больше загрузить нельзя. Компания расширила список цензурируемых слов. Например, в новых появилось слово chest («грудь» или «сундук»).

Если вы нашли опечатку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Статьи

Новости

Джордж Мартин намекнул на фильм по Elden Ring

Новости

Для «Смуты» анонсировали большое дополнение про казака Киршу
Пока без даты релиза.

Новости

Слух: в TES 6 появятся морские сражения и строительство кораблей в духе Starfield
Игру могут показать в июле 2025-го.

Новости

Marvel заморозила сразу три супергеройских сериала
Официально шоу не получили зеленый свет от Marvel.

Новости

«Аватар» получит сиквел — про мага Земли
Всего будет 26 эпизодов

Новости

По «Хроникам Нарнии» могут снять восемь фильмов
Об этом обмолвился глава IMAX.

Новости

«Разделение» стало самым просматриваемым сериалом в Apple TV+
Шоу обогнало «Теда Лассо»

Новости

Джордж Мартин мог закончить цикл книг «Колесо времени» вместо Брэндона Сандерсона
Но выбор вдовы Роберта Джордана все-таки пал на Сандерсона, который на тот момент еще не был так популярен.

Новости

Первый тизер хоррора «Верни ее назад» от A24
Выйдет 30 мая

Новости

Сооснователь Riot надеется, что MMO по League of Legends выйдет раньше, чем люди окажутся на Марсе
Это его любимый проект
Показать ещё