NVIDIA и Стэнфордский университет представили нейросетевую модель Test-Time Training, с помощью которой можно создавать минутные ролики со сложными и последовательными сюжетами.
TTT обучили на 50 часах мультфильма «Том и Джерри» и с помощью нее сгенерировали новые «эпизоды» — без редактирования. В них все еще встречаются артефакты, но это обусловлено ограниченными возможностями и ресурсами.
Исследователи уверены, что этот подход можно будет распространить на длинные видео и еще более комплексные истории.
Исходные код TTT выложили в открытый доступ.
Если вы нашли опечатку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.