OpenAI создали алгоритм, генерирующий осмысленные тексты

2536
2 минуты на чтение
OpenAI — некоммерческая исследовательская компания, которая занимается вопросами искусственного интеллекта, распознавания образов и тренировкой нейросетей. Её сформировали ещё в 2015 году, причём одним из основателей был предприниматель Илон Маск. С тех пор команда исследователей несколько раз демонстрировала любопытные результаты в области изучения ИИ — например, в 2017-м бот OpenAI победил сильнейших игроков в Dota2.

Команда учёных под руководством Алека Рэдфорда (Alec Radford) создала алгоритм GPT-2, который научился генерировать осмысленные тексты — на основе уже прочитанного материала. Исследователи собрали базу данных WebText из 40 гигабайт с восьми миллионов страниц в интернете. Авторы опирались не только на новостные заметки, а на самые разные материалы, в том числе и на заметки с Reddit. Программа рассматривала посты, собравшие больше трёх «плюсов».

После того, как обучение было завершено, исследователи обнаружили, что алгоритму можно «скормить» небольшой отрывок текста, а на выходе получить материал, основанный на первоначальной идее.

Вот такой текст показали алгоритму в одном из примеров:

Шокирующая находка — учёные нашли стадо единорогов, обитающих в удалённой, ранее не исследованной долине в Андах. Ещё большей неожиданностью стало то, что единороги разговаривают на идеальном английском.
GPT-2 сгенерировал девять абзацев. Мы перевели первые три:

Учёные назвали эту популяцию в честь выдающегося рога — единороги Овида. Эти четверорогие серебристо-белые единороги ранее не были известны науке.
Теперь, спустя почти два века, загадка возникновения этого удивительного феномена наконец-то разрешена.
Доктор Хорге Перетц, биолог-эволюционист из университета Ла-Пас, вместе с несколькими компаньонами занимались исследованием Анд, когда они обнаружили небольшую долину, где не было животных или людей. Перетц заметил нечто похожее на естественный фонтан, окружённый двумя скалистыми пиками и серебристым снегом.
Исследователи не выложили программный код обученной модели целиком, поскольку они боятся «недобросовестного использования». Вместо этого они опубликовали лишь упрощённую модель и описали проделанную работу в статье.

Если вы нашли опечатку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Статьи

Новости

Джордж Мартин намекнул на фильм по Elden Ring

Новости

Для «Смуты» анонсировали большое дополнение про казака Киршу
Пока без даты релиза.

Новости

Слух: в TES 6 появятся морские сражения и строительство кораблей в духе Starfield
Игру могут показать в июле 2025-го.

Новости

Marvel заморозила сразу три супергеройских сериала
Официально шоу не получили зеленый свет от Marvel.

Новости

«Аватар» получит сиквел — про мага Земли
Всего будет 26 эпизодов

Новости

По «Хроникам Нарнии» могут снять восемь фильмов
Об этом обмолвился глава IMAX.

Новости

«Разделение» стало самым просматриваемым сериалом в Apple TV+
Шоу обогнало «Теда Лассо»

Новости

Джордж Мартин мог закончить цикл книг «Колесо времени» вместо Брэндона Сандерсона
Но выбор вдовы Роберта Джордана все-таки пал на Сандерсона, который на тот момент еще не был так популярен.

Новости

Первый тизер хоррора «Верни ее назад» от A24
Выйдет 30 мая

Новости

Сооснователь Riot надеется, что MMO по League of Legends выйдет раньше, чем люди окажутся на Марсе
Это его любимый проект
Показать ещё