На днях Яндекс запустил собственную нейросеть по созданию изображений из текстового описания — «Шедеврум». Как и Midjourney, она использует принцип каскадной диффузии: сначала создаёт картинки в соответствии с запросом, затем поэтапно увеличивает их разрешение и добавляет детали. Больше всего «Шедеврум» напоминает ранние версии Stable Diffusion и той же Midjourney.
Пока что готова только бета-версия. Она доступна в мобильном приложении с ограниченным функционалом. Созданные работы публикуются в общей ленте, где можно ставить «лайки» и отслеживать изображения других пользователей.
В «Шедевруме» ограничены запросы: нельзя касаться тем религии и политики, нельзя задействовать реальных людей, нельзя создавать контент 18+, а также использовать для тем, касающихся жестокости и насилия. Как показала проверка, реальных персонажей от вымышленных персонажей нейросеть не разбирает — например, запрос «фильм „Понедельник начинается в субботу“ от создателей „Иван Васильевич меняет профессию“» она не обработала по этой причине.
Мы «скормили» нейросети несколько запросов с выражениями, а также названия фантастических рассказов. Получившимися изображениями наверняка можно было бы проиллюстрировать рассказы, но соглашение гласит, что их можно использовать только в личных некоммерческих целях — никаких нейрообложек или настольных игр.
Сперва несколько выражений. Второе не слишком-то и получилось:
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 1](https://www.mirf.ru/wp-content/uploads/2023/04/photo_2023-04-07_11-33-18.jpg)
Конь в пальто
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 2](https://www.mirf.ru/wp-content/uploads/2023/04/photo_2023-04-07_11-44-05.jpg)
Натянуть сову на глобус
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 3](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bbf7490a631c_upscaled.jpg)
Поле чудес в стране дураков пиксель-арт
А с этой картинкой у нейросети и вовсе не очень получилось — на всех четырёх вариантах рот был. Эта хотя бы более-менее подходит под рассказ Харлана Эллисона:
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 4](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc1583d69b94_upscaled.jpg)
У меня нет рта, но я хочу кричать
Названия рассказов Говарда Лавкрафта отлично подходят в качестве запросов.
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 6](https://www.mirf.ru/wp-content/uploads/2023/04/photo_2023-04-07_12-05-26-1.jpg)
Сомнамбулический поиск неведомого
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 7](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc46c1d0757f_upscaled.jpg)
Хребты безумия
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 8](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc3999f87c66_upscaled.jpg)
Грёзы в Ведьмином доме
И ещё немного классики: от Рэя Брэдбери, Роберта Шекли и других фантастов:
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 9](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc583158a6b0_upscaled.jpg)
Каникулы на Марсе
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 11](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc63f9cd5ce0_upscaled-1.jpg)
Робот, который был похож на меня
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 12](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc695e7db56f_upscaled.jpg)
Самый странный бар во вселенной
![Робот, Марс, конь в пальто и Хребты безумия: что умеет нейросеть «Шедеврум» от Яндекса 14](https://www.mirf.ru/wp-content/uploads/2023/04/5f8bc6d6b1cc6e3_upscaled-1.jpg)
Башня из грязи и веток
![Фото аватара](https://www.mirf.ru/wp-content/uploads/2021/05/Kot-imperator-mirf-100x100.jpg)