Настольная книга для тех, кто хочет понимать искусственный интеллект

Привет.

Некоторые книги покупаю наобум, ничего про них не знаю, но положение обязывает, нужно читать по своим темам то, что выходит в разных издательствах. Иногда обложка совершенно не соответствует тому, что находишь в книге, и в случае «Кокетливого интеллекта» от Джанель Шейн это именно так.

Яркая, в какой-то мере игривая обложка чем-то напоминает книги для дураков, наверняка помните такую серию с чрезмерными упрощениями сложных понятий. Задача такой литературы — простыми словами объяснить сложные концепции, но почти всегда получается дурно, читать их больно, так как они страдают упрощениями, порой искажениями информации. Да и тема нейросетей, алгоритмов AI настолько избита, что появляются тонны литературы, многие книги пересказывают банальности, кочующие из одного издания в другое. Ничего не ждал и тут, тем большим было мое удивление и восторг, проглотил книгу моментально.

В чем заслуга этой книги? Ответ коренится в подходе и примерах, которые приводятся в каждой главе. Это не просто теоретические описания AI-алгоритмов и того, как работают нейросети, напротив, это последовательное объяснение на примерах. Причем вопросы затрагиваются очень широко и ненавязчиво, вам не предлагают только одну точку зрения, а напротив, дают пространство для размышлений. Смело могу назвать эту книгу настольной для современного человека, на сегодняшний день это лучшее пособие (именно так и его можно назвать!) для того, чтобы разобраться, как устроены алгоритмы и с какими трудностями сталкиваются их создатели.

Мне импонируют люди, которые используют пословицу программистов: мусор на входе означает мусор на выходе. Очень простая и действенная максима, которая стала еще важнее в нашем мире больших данных. Недостаточно скормить «умному» алгоритму данные, нужно понимать, что это за данные и как они соотносятся с другими вещами.

Приведу простой пример. Обучение алгоритма идет на размеченных данных, для этого компании нанимают людей! Например, такой человек должен смотреть видео и отмечать на нем пешеходов, автомобили, препятствия. Затем размеченное видео скармливается алгоритму, и на его примере он обучается. Просто и легко, не так ли? Но на деле оказывается, что люди ленятся или стараются обмануть систему, когда ради вознаграждения отмечают большее число предметов, чем в реальности видят на экране. Они работают над увеличением своего дохода. Но для обучения алгоритма это плохие данные, и компании вынуждены искать способы получить максимально точную информацию.

Другой пример, над которым мы не задумываемся. AI-алгоритмы сегодня используются даже при наборе текста на клавиатуре вашего телефона, они пытаются предсказать, какие слова вы хотите написать дальше. Иногда алгоритм делает неверные выводы, не может правильно оценить вероятность события. Вот что об этом говорит Даан ван Эш, работающий в Google над клавиатурой Gboard: «До какого-то момента, если вы печатали “Я собираюсь к бабушке на”, Gboard автоматически подставлял “похороны”. В целом, это могло оказаться верным. Возможно, такой вариант встречается чаще, чем “рейв-вечеринку”. Но в то же время это не то, о чем вам хотелось бы то и дело получать напоминания. Так что нам следует проявлять осторожность в подобных делах».

Мы очень часто наделяем алгоритмы всемогуществом, поскольку не понимаем, как они работают. Давайте посмотрим на другой пример. Ученые в Google создали алгоритм распознавания простых рисунков Quick Draw. Они скормили алгоритму миллионы рисунков, сделанных людьми от руки, и научили распознавать три сотни разных предметов. Посмотрите на картинку, где есть небольшой набор данных, который описывает рисунки кенгуру, на самом деле их намного больше.

Всего алгоритм знает 345 предметов и прекрасно их распознает в любом рисунке, сделанном от руки. Кажется, что он работает идеально. Но давайте попробуем нарисовать предмет, который алгоритм не знает, например, курительную трубку. По мнению Quick Draw, это с высокой вероятностью лебедь или садовый шланг.

Зависимость от обучающих данных приводит и к другим несуразностям. Когда у вас есть алгоритмы, обученные на одном наборе данных, то они понимают друг друга с полуслова. Например, вы просите нарисовать маленькую девочку, что ест большой кусок торта. Вам выдают несуразную картинку, в которой вы не сможете узнать ни торт, ни девочку, это какая-то мешанина образов на экране. На кусках торта расположены волосы, глаза улетели в край экрана. Не всякое воспаленное воображение сможет изобразить такое.

Возьмем картинку, нарисованную нейросетью, и скормим ее системе распознавания образов, которая натренирована на том же наборе данных. И знаете, что мы увидим? Нам опишут изображение как «маленькая девочка, которая ест кусок торта». Алгоритмы умеют распознавать свои образы, если они имеют общий опыт.

Нам важно точно понимать границы применимости AI-алгоритма, что именно он умеет делать, на каких данных он натренирован. Для нас многие AI-алгоритмы — это черный ящик, и мы не знаем, что именно происходит внутри него. Мы не прописываем пошаговый алгоритм, как должна решаться та или иная задача, что зачастую приводит к удивительным результатам, например, алгоритмы создают смешные конструкции, которые не выдерживают проверки реальным миром, отрицают законы физики. Но в математических моделях они могут существовать. Инженеры закладывают систему вознаграждений, чтобы алгоритмы шли в правильном направлении, и вот комментарий об этом Алекса Ирпана из Google: «Я начал воспринимать ИИ как демона, который интерпретирует систему вознаграждений заведомо неправильно и активно ищет решение, требующее минимальных усилий. Это несколько глупо, но, как выяснилось, иметь такой настрой очень полезно». Тут можно добавить, что алгоритмы часто не понимают нашей задачи, не знают ее и «играют» совсем в другие игры, что и приводит к странным результатам. Научиться правильно формулировать задачу — это отдельное умение.

Алгоритмы проникают во все сферы жизни. Когда вы приходите на собеседование, камеры пытаются проанализировать ваше выражение лица и мимику, создать ваш психологический портрет. Алгоритмы оценивают ваше резюме еще до того, как оно попадет к живому человеку. Таких систем с каждым днем становится все больше и больше, каждая из них по отдельности не играет большой роли, но вместе они создают окружающий нас мир. И тут важно понимать, как этот мир устроен, как обучаются алгоритмы и как они работают.

Данная книга прекрасна тем, что объясняет простым языком, с чем мы имеем дело, как обучают алгоритмы и что они умеют, а чего не умеют. Исчезает магия фокусника, возникает понимание вещей, из которых состоит наш мир. И это очень важно, если вы являетесь частью этого мира. Знание уничтожает страхи перед технологиями, делает их простыми.

Тираж книги — всего 2000 экземпляров. И это очень немного, ведь такая книга будет полезной любому человеку и поможет разобраться в том, как устроены те или иные вещи. Джанель Шейн проделала удивительную работу, смогла найти простые примеры и слова, чтобы объяснить сложные алгоритмы и показать пределы их возможностей. Так что рекомендую вам обзавестись этой книгой, она просто обязательна к прочтению, особенно если это не сфера ваших профессиональных интересов.

[email protected]
наверх