Книга, написанная алгоритмом ruGPT‑3, дорогая реклама SberDevices

Привет.

Какое-то время назад вышла книга «Пытаясь проснуться» за авторством Павла Пепперштейна и алгоритма ruGPT-3, запущенного на суперкомпьютере от «Сбера» «Кристофари». Поэтому на обложке есть и второе имя — Нейро Пепперштейн. Этакое альтер эго писателя и художника.

Издательство Individuum любит эксперименты, и поэтому книга отлично вписывается в их изыскания. Напомню, что в прошлом году в этом же издательстве вышла книга Дэниела Сасскинда «Будущее без работы», она примечательна тем, что переведена с помощью автоматического переводчика от «Яндекса», обложка нарисована AI-алгоритмом.

То, насколько хорошо получилось перевести книгу, мы обсуждали отдельно, тут про это говорить не будем.

Давайте вернемся к сборнику рассказов от Пепперштейна, в книге их двадцать четыре, половина написана живым человеком, вторая половина — алгоритмом ruGPT-3. Причем рассказы перемешаны, узнать, кем написан конкретный текст, нельзя. Впрочем, в этом нет никакой особой загадки, так как автор использовал трюк: вначале тексты были созданы алгоритмом, а потом уже живой Пепперштейн подстроился под их стиль и темы. У меня нет сомнений, что человек может копировать стиль алгоритма, а вот обратная ситуация пока остается фантастикой. Нужно держать в голове этот трюк, когда вы будете восхищаться тем, что тексты сравнимы и одинаковы.

Обложка книги шикарна, картинка переливается и меняется в зависимости от угла зрения так же, как календари или открытки в детстве. Можно смело сказать, что эта книга — первая в мире, где половина текста написана алгоритмом.

Алгоритм ruGPT-3 запустили на суперкомпьютере «Кристофари», ему скормили большую часть текстов Павла Пепперштейна. Дальше начался отбор текстов, калибровка алгоритма. Отбрасывались неудачные версии, уточнялся стиль автора, затем процесс повторялся вновь, пока на выходе не получили удачные варианты. Корректор работал над текстами, чтобы причесать их, но сами тексты не меняли под восприятие человека, не добавляли туда той или иной логики.

Создание модели на примере живого человека не очень легкая задача. Например, Татьяна Шиврина из команды AGI NLP в предисловии к книге делится тем, что алгоритм постоянно пытался писать плохие стихи, составляя сложные предложения, запутывался в родовых и падежных окончаниях. Но самое главное, что все рассказы получались без финала, уходя в некий абсурд. Модель постоянно достраивали, скармливали новые данные. Имея под рукой суперкомпьютер, можно заниматься такими экспериментами, но для 99% компаний и людей они просто недоступны.

Сценарист и аналитик AGI NLP Денис Шевелев так описал тексты алгоритма: «Трудность работы секретарем у писателя-машины была не в том, что время от времени генерация оказывалась неудачной. Наоборот, иногда труднее было поверить, что текст, который ты сейчас читаешь, создан не человеком… И дождаться от модели, когда она решит продолжать именно его, а не вилять сюжетно в одну или другую сторону, откуда может не вернуться к столь увлекательно начатой истории. Потому что каждое такое возвращение становилось открытием».

Читал книгу в два приема. Первую часть прочитал сразу после покупки, озадачился и задумался, отложил на пару недель, после чего дочитал. Причина такого поведения в том, что хотел дать устояться мыслям, не пытался проглотить книгу моментально. Для меня вся книга выглядит бессвязным абсурдом, который не имеет смысла, словно написан сумасшедшим, мысли которого скачут с одной темы на другую. И Пепперштейн отлично справился со своей задачей, замаскировал человека под этакого Шалтай-Болтая.

По мнению издателя Феликса Сандалова, вклад нейросети по определению безумен, но она умеет загадывать загадки и рассказывать историю. И я склонен согласиться с тем, что не все люди умеют это делать. В издательстве выходили книги, написанные в очень странных стилях, например, треть книги «Муравечество» Кауфмана — это кислотный трип. Нужно ли копировать такое разобранное сознание? Не уверен. Но это явно не та литература, которой многие ждут, к которой привыкли. Эксперимент.

Причем не просто эксперимент по натаскиванию алгоритма, а важная работа по изучению пределов возможного. Также это демонстрация полезности таких моделей, что важно для SberDevices (теперь, правда, это «СалютДевайсы», переименование случилось на фоне санкций). Как-то незаметно стало принято оценивать алгоритмы, перенося их на возраст ребенка. Но говорить, что это работа пятилетнего, а вот тут — десятилетки, не хочу. Мне такая оценка кажется сложной и неправильной, она сбивает нас с толку. Алгоритм не человек, он узкоспециализированный. Например, в AI-рисовалке Midjourney нет сознания, она делает примерно то же самое, что и алгоритм ruGPT-3, но только в отношении картинок.

С каждым годом алгоритмы будут усложняться. Прекрасно помню, как лет десять назад нас пугали тем, что скоро новости будут писать исключительно программы. К сожалению, этого не случилось, а так хотелось бы. Ведь алгоритмы написания новостей очень просты, и программа, в отличие от человека, меньше ошибается. В паре русскоязычных новостных каналов утверждается, что их ведут роботы, но это чистой воды маркетинг, новости там написаны людьми. Так что горевать о том, что алгоритмы отнимут у нас работу, смогут создавать нетленные произведения искусства, нельзя. Они справляются пока с очень базовыми вещами, причем без участия человека сделать этого не могут.

Если посчитать, сколько электричества и вычислительной мощности потрачено на создание Нейро Пепперштейна, который остается несамостоятельным, окажется, что проще воспитать пару-тройку неплохих авторов, которые будут выдавать более связные тексты. За очарованием новыми технологиями мы часто забываем посчитать, сколько они стоят и что нужно сделать для их реализации на практике.

Не верю в то, что человека можно заменить, наша история показывает, что мы умеем хорошо приспосабливаться, в том числе к изменениям, которые приносят инструменты, созданные нами же. Отсюда простой вывод — какие-то базовые вещи, то, что называется работой ремесленников, мы сможем повторять алгоритмами. А вот творчество, полет фантазии повторить не удастся. На примере этого текста хорошо видно, что работает только симбиоз машины и большой команды людей. А значит, в будущем потребуется сократить число таких людей до одного пользователя, который сможет работать в связке с машиной, направлять ее и обучать. Но это дело недалекого будущего.

Говоря про эту книгу, могу косвенно судить о том, что она наделала шума. При мне в книжном пара девушек искали ее на полках, в «Подписных изданиях» из Нейро выложили горку в большом зале. Одним словом, книгу продвигают как нечто новое и необычное. Но восторгов тех, кто восхищается текстом и видит в рассказах какой-либо смысл, не разделяю. Его там нет. Король голый, и это нужно признать, чтобы за ширмой алгоритма не скрылась суть. Книги мы читаем для развлечения, а тут его, увы, не наблюдается. И эта книга — просто веха в развитии технологий, но к литературе она не имеет никакого отношения. Этакое шоу, в котором художник немного ранит публику и ее чувства, показывает что-то новенькое.

[email protected]
наверх