Исследователи из университета Торонто создали и обучили нейросеть, которая может создавать музыкальные произведения на основе изображений, пишет издание
The Guardian. В режиме реального времени нейросеть анализирует фотографию, а затем создаёт музыкальный ряд и тексты песни. Чтобы проверить работу нейросети, авторы исследования «показали» ей фотографию рождественской ёлки. Вот что получилось:
https://vimeo.com/192711856
В своём исследовании учёные опираются на нейросеть, которую обучили создавать поп-песни. Эта нейросеть обучена на базу данных, хранящей 100 часов музыки. Программа не только умеет генерировать общий музыкальный фон, но и учитывает самые популярные последовательности аккордов и добавляет ударные.
После этого исследователи «научили» нейросеть распознавать фотографии — точно так же, на базе готовых фотографий с метками. Таким образом, искусственный интеллект распознает, что запечатлено на изображении и генерирует поток слов. Синтезированная таким образом песня очень напоминает песенку GLaDOS из первой части видеоигры Portal.