По материалам The Verge
Когда в конце 2022 года вышел ChatGPT, первое, что сделал Марк Хамфрис, — попросил программу проделать обычные трюки, например, написать стихи в стиле Боба Дилана. Результат впечатлил, но не показался особенно полезным Марку, историку, изучающему торговлю мехом в XVIII веке. Хамфрис, 43-летний профессор Университета Уилфрида Лорье в Ватерлоо в Канаде, уже давно интересовался тем, как можно применить искусственный интеллект в его работе. Он уже пользовался специальным инструментом распознавания текста, предназначенным для расшифровки устаревших рукописей и шрифтов, хотя тот и допускал частые ошибки, на исправление которых приходилось тратить время. Марк с любопытством скормил ChatGPT распознанное с ошибками рукописное французское письмо. ИИ исправил текст, восстановив все буквы «F», которые были ошибочно прочитаны как «S», и даже добавив недостающие значки. Затем Хамфрис попросил ChatGPT перевести письмо на английский. Программа сделала и это. Возможно, подумал историк, эта штука все-таки окажется полезной.
Для Хамфриса инструменты искусственного интеллекта таят в себе много надежд. За последнее десятилетие миллионы документов в архивах и библиотеках были отсканированы и оцифрованы (Хамфрис сам принимал участие в одном из таких мероприятий), но поскольку большое разнообразие форматов, шрифтов и словарного запаса делало их непригодными для автоматического поиска информации, работа с ними требовала серьезного личного вмешательства. Для своего предыдущего проекта Хамфрис собрал биографии нескольких сотен солдат Первой мировой войны, получивших контузию, из различных медицинских записей, военных дневников, газет, личных дел и других источников. Потребовались годы и усилия целой команды научных сотрудников, чтобы прочитать, разметить и снабдить перекрестными ссылками собранные на каждого человека материалы. «Если новые языковые модели так мощны, как кажутся, возможно, получилось бы просто загрузить весь этот материал и попросить модель извлечь все документы, относящиеся к каждому солдату», — подумал профессор.
«Это работа всей жизни или, по крайней мере, десятилетия, — говорит Хамфрис. — И можете себе представить, как ее можно масштабировать. Вы можете заставить ИИ выяснить, был ли солдат ранен в дату X, что происходило с этим подразделением в дату X, а затем получить доступ к информации о членах этого подразделения, на точечный поиск которой у вас как у историка никогда нашлось бы времени. Это может открыть новые способы понимания прошлого».
Усовершенствованное управление базами данных, возможно, далеко от образа завоевавшего мир сверхразума, который некоторые представляют в будущем. Но именно так языковые модели могут систематизировать реальный мир. От юриспруденции до программирования и журналистики — профессионалы пытаются выяснить, как можно и можно ли вообще интегрировать эту многообещающую, рискованную и очень странную технологию в свою работу. Для историков технология, способная обрабатывать целые архивы и одновременно склонная к фабрикации фактов, выглядит столь же привлекательно, сколь и пугающе. И в этой области, как и во многих других, только начинается борьба с последствиями применения такого потенциально мощного, но неоднозначного метода.
По словам Синди Эрмус, доцента истории Техасского университета в Сан-Антонио, тема ИИ звучала повсюду на 137-м ежегодном собрании Американской исторической ассоциации в прошлом месяце. Эрмус описывает свое отношение и отношение многих ее коллег к ИИ как подход «любознательных детей», которые одновременно с волнением и настороженностью задаются вопросом, что и как изменится в их работе. «Это изменит каждый аспект исторических исследований: от коллекционирования до кураторства, письма и, конечно же, преподавания», — говорит она. Особое впечатление на нее произвела презентация преподавателя Ланкастерского университета Кэтрин Макдонаф о программе машинного обучения, способной выполнять поиск по историческим картам, но первоначально обученной на картографии Британии XIX века.
«Она ввела в поиск слово “ресторан”, и она [программа] нашла слово “ресторан” на множестве разновременных исторических карт», — рассказала Эрмус. — Для неисторика это может показаться не таким уж важным, но раньше у нас никогда не было возможности такое делать, а теперь этот инструмент у нас под рукой».
Другой участник мероприятия, Лорен Тилтон, профессор искусств и цифровых гуманитарных наук в Университете Ричмонда, работала с машинным обучением более десяти лет и недавно в сотрудничестве с Библиотекой Конгресса применила компьютерное зрение к огромным архивам фотографий и фильмов с минимальной маркировкой. Все архивы по сути своей тенденциозны — от того, в каком виде изначально хранится информация, до того, как она организована. По словам профессора, ИИ обещает сделать архивы более доступными для поиска вещей, которые в прошлом не считались достаточно ценными, чтобы отдельно их отмечать.
Однако системы искусственного интеллекта имеют свои собственные предубеждения, ведущие к искажениям. Поскольку подавляющее большинство обучающих данных взяты из современного Интернета, модели отражают нынешнее мировоззрение. Тилтон столкнулась с этим явлением, когда обнаружила, что системы распознавания изображений с трудом понимают старые фотографии, например, маркируя пишущие машинки как компьютеры, а пресс-папье как мыши. Схожая проблема и у языковых моделей.
Впечатленный возможностями ChatGPT, профессор Хамфрис подписался на OpenAI API и решил стать помощником по исследованиям в области искусственного интеллекта. Он пытался отследить торговцев мехом XVIII века в прорве писем, журналов, свидетельств о браке, юридических документов, приходских записей и контрактов, в которых они фигурируют лишь мимолетно. Его целью стала разработка системы, которая могла бы автоматизировать этот процесс.
Одной из первых проблем, с которыми он столкнулся, было то, что речь торговцев мехом XVIII века звучала совсем не так, как предполагает языковая модель. Попросите GPT-4 создать образец записи, и он выдаст длинные размышления о возвышенном одиночестве дикой природы, что-то вроде: «Этим утром небеса разверзлись, пролившись настойчивым дождем, отчего лес окутала завеса тумана и меланхолии». Или: «Бруно, который встречал все трудности со стоицизмом опытного лесника, теперь лежал мертвым под сенью импровизированного навеса, молчаливым свидетельством хрупкости жизни в этих диких землях».
Настоящий торговец мехом выразился бы гораздо более лаконично. Например, «Прекрасная погода. Сегодня утром умершего вчера молодого человека похоронили, а его могилу огородили жердями. 9 человек пошли собирать камедь, чтобы просмолить 3 каноэ, остальные работали как вчера». Так и писал один из них в 1806 году, имея в виду сбор древесной смолы для заделки швов их лодки.
«Проблема в том, что языковая модель не справится с такой записью, потому что она не содержит нужного типа рефлективного письма, который она обучена воспринимать как репрезентативный для такого события», — говорит Хамфрис. Натренированный на современных записях в блогах и эссе, ИИ ожидает, что за смертью товарища последуют длительные эмоциональные воспоминания, а не инвентаризация запасов смолы.
Натренировав модель на сотнях примеров письменных текстов торговцев мехом, Хамфрис добился того, что она извлекала дневниковые записи в ответ на вопросы, но не всегда релевантно. Устаревший словарный запас по-прежнему составлял проблему — такие слова, как varangue, французский термин, обозначающий ребро-шпангоут каноэ (если точнее, то русское название этого элемента набора корпуса судна — флор), редко появлялись в обучающих данных модели, если вообще когда-либо появлялись.
После долгих проб и ошибок историк получил сборку на основе искусственного интеллекта, использующую несколько моделей для сортировки документов, поиска в них ключевых слов и значений, а также синтезирования ответов на запросы. Это заняло много времени и потребовало много усилий, но GPT помог ученому и выучить Python в необходимом объеме. Профессор назвал систему HistoryPearl в честь своего умного котика.
Инструменту не хватало некоторых вещей, но он работал лучше, чем среднестатистический аспирант, которого Хамфрис нанял бы для работы такого рода. И быстрее. И намного, намного дешевле. В ноябре прошлого года после того, как OpenAI снизила цены на API, он провел грубые подсчеты. То же, за что он заплатил бы аспиранту около 16 000 долларов за работу в течение всего лета, GPT-4 мог сделать примерно за 70 долларов, потратив около часа.
Профессор говорит, что ему было интересно как исследователю и страшно как педагогу. Организация учета торговли мехом может осуществляться нишевым приложением, но ведь огромное количество офисных должностей завязано на выполнении аналогичных задач по работе с информацией. Его студенты должны были получить те исследовательские и мыслительные навыки, которые позволили бы им добиться успеха именно в таких видах деятельности. В ноябре он опубликовал информационный бюллетень, призывая своих коллег из академических кругов серьезно отнестись к быстрому развитию искусственного интеллекта. «ИИ начинает превосходить воображение многих людей, — написал он. — Они все еще говорят об этой технологии так, как будто это теоретическая вещь, не осознавая при этом, что она представляет собой вполне реальную, экзистенциальную угрозу всему смыслу нашего существования как педагогов».
Однако он был рад, что его работа привела его к тому, что он называет «доказательством концепции»: инструмент достаточно надежен, чтобы быть потенциально полезным, но еще не до такой степени, чтобы полностью доверять ему. Хамфрис и его соавтор, историк Лианна Ледди, подали грант на расширение своего исследования до всех 30 000 вояджеров в базе данных. Он утешился тем, что для разработки этой системы потребовалось деятельное участие человека. Наибольший прогресс в работе модели был достигнут благодаря предоставлению ей правильных данных, что стало возможным благодаря его собственному опыту работы с материалом. В последнее время Хамфрис задумывается о том, что может возникнуть большой спрос на экспертов, обладающих навыками исследования и критической оценки, а именно этому учат гуманитарные науки. В этом году он будет преподавать разработанную им программу прикладного генеративного искусственного интеллекта на факультете искусств.
«В каком-то смысле это старое вино в новых бутылках, верно?» — профессор отмечает, что в середине XX века компании располагали обширными корпоративными архивами, где работали исследователи, которые были экспертами не только в хранении и систематизации документов, но и в самом предмете. «Чтобы большая часть этих данных стала полезной, нужны люди, которые обладают не только способностью понимать, как обучать модели, но, что более важно, понимают, что такое хороший контент, а что нет. Я думаю, это обнадеживает», — говорит он. — Ну или я просто вру себе».
>> подали грант на расширение своего исследования до всех 30 000 вояджеров в базе данных. Он утешился тем, что для разработки этой системы потребовалось деятельное участие человека. Наибольший прогресс в работе модели был достигнут благодаря предоставлению ей правильных данных,Самый большой недостаток современных моделей, крайне медленная адаптация под специфику. Человеку достаточно единиц обучающего материала (обучение с учителем) и уже сможет, пусть с постконтролем, разобрать десятки единиц материалов. Исследовав ошибки обработки у этих десятков, уже самостоятельно набивать руку на следующих материалах, с очень быстрым приближением к теоретическому пределу качества.Как пример, из самой больной для себя темы — омографов. Предположу, что слово чума`, вам стало известно на уроках истории. Слово не самое популярное и встретилось всего несколько десятков раз, прежде чем попалось слово чу`ма (р.п. чум). Возможно слова вам встретились в другом порядке, не важно. Сколько понадобится примеров, чтобы начать распознавать смыслы со 100-процентной вероятностью? Думаю хватит всего нескольких штук, чтобы обобщить их до болезнь/жильё и соответственно распознавать. Модели не хватит и сотен предложений. И даже после тысяч, в которых её ткнут носом — вот это про жильё! вот это про болезнь! вот это…. — продолжит делать ошибки.Такая разница прослеживается во всех предметно-специфичных областях. Сложность обучить модель каждому кунштюку в тысячи и десятки тысяч выше, чем научить ему живого ученика.