Привет.
Каждый год весной Google проводит конференцию I/O, на которой делится самыми главными новостями о своих разработках. Во многом они определяют то, какими будут продукты компании и на что стоит рассчитывать нам с вами. Многие разработки становятся стандартом для рынка, но само мероприятие привлекает не такое большое внимание со стороны конечных потребителей. Зачастую за технологиями сложно увидеть их реальное применение, есть ощущение, что не хватает воображения, а в Google так и не смогли сделать I/O сравнимым по восприятию с WWDC от Apple. Давайте вместе посмотрим, что показали за два часа и как эти технологии могут изменить нашу жизнь и разработки, которые ведут другие компании.
Языковые модели, AI-алгоритмы и другие улучшения
Не секрет, что именно Google является крупнейшим разработчиком в области работы с языками — в любом Android-смартфоне сегодня вы найдете основные языки. Компания постоянно улучшает свои продукты, добавляет возможность перевода с одного языка на другой и продолжает расширять список поддерживаемых языков, в этот раз добавилось 24 языка. Нетрудно вообразить, что в какой-то момент Google сможет добавлять и мертвые языки, что даст простор для творчества ученых, а быть может, мы увидим и создание искусственных языков. И отныне тот же Star Trek получит полноценный язык, который будет жить и развиваться, а не ограничится небольшим числом фраз.
Пожалуй, что стратегия Google выигрышная, так как компания создает инструменты для работы с языком в самом широком смысле этого слова. И это дает возможности менять практически все что угодно. Например, Nest Hub Max может воспринимать ряд команд без слова-маркера, то есть вам не нужно его предварительно активировать. В наших условиях это значит, что вместо команды «Алиса, выключи свет в спальне», можно просто сказать, что нужно сделать. И вы сами можете регулировать число команд, которые будут срабатывать без активации отдельным управляющим словом. Мне такой подход очень нравится, так как это намного удобнее, чем постоянно талдычить «Алиса, сделай это, Алиса, сделай то». Честно говоря, постоянное произношение слова «Алиса» девальвировало имя как таковое. Красивое имя, но девочкам его дают все реже с распространением умного дома от «Яндекса».
Задача технологий — брать на себя рутину, делать жизнь проще. Например, вы снимаете видео или смотрите какую-то длинную лекцию, где автор не разбил видео на главы. Теперь YouTube сделает автоматическую разметку, автоматически создаст главы, которые станут вашим оглавлением. И, конечно же, выросло число видео с автоматическими титрами, теперь их более 80 млн на площадке, за год число выросло на порядок. И в будущем таких видео будет становиться все больше и больше, автоматические титры — шикарная штука.
На I/O это не было сказано в лоб, но проблема, с которой сталкивается каждый из нас, это информационная перегрузка, зачастую информации слишком много, и мы в ней тонем. Обыденная ситуация: вам присылают документ, в котором сотня страниц, нет оглавления или короткой выжимки того, что там самое главное. Многие натренировали умение просматривать документ по диагонали и зачастую пропускают что-то важное для работы. В Google Docs теперь появляется возможность автоматически создавать аннотацию, когда в начале документа вы видите выжимку из главных пунктов в нем. Это не оглавление, а именно короткая аннотация. Аббревиатура TL; DR (too long, didnt read) может уйти в прошлое, а ведь сегодня это актуальная проблема для всех.
Объединение информации, выделение главного становятся одной из ключевых задач. Другим примером, который меня радует, являются чаты — зачастую в рабочих чатах помимо важной информации содержится много флейма, вы просто теряетесь в нем. И вот тут ровно такие же аннотации могут помочь, они выделяют значимую информацию, выпаривают все ненужное. Круто? Не то слово.
Компьютеры зачастую воспринимаются как бездушные машины, а кривляния с попыткой придать им эмоции только подчеркивают этот момент. Мне кажется, что тут есть возможность для множества разработок, и одна из них — это языковая модель для диалогов, которую показали год назад (LaMDA), в этом году она добралась до второй версии и получила AI Test Kitchen. Диалоги крайне важны в человеческом общении, и теперь в Google хотят улучшить умение их вести.
В AI Test Kitchen показали несколько примеров. Вы можете спросить, каково быть на дне океана, и тут же получить подробный ответ. Следующие вопросы будут раскрывать тему, получится диалог. Ровно та же история про возделывание своего сада и последующий разговор. Модель выглядит многообещающей, но понятно, что это только первые шаги.
Но на меня произвела большее впечатление модель PaLM (Pathways Language Model), которая меняет то, как выглядит общение с компьютером. Обычно вы задаете вопрос и тут же получаете ответ. Просите решить задачку, и на выходе у вас есть число, как оно получено, непонятно. Отныне можно видеть решение задачи, то есть вы видите не просто ответ, но и логику, что стоит за ним. И это очень полезно во всех смыслах, так как позволяет думать и подсматривать алгоритм решения. Для школьников неоценимая помощь в математике и других науках.
Про инвестиции в новые дата-центры, которые нужны для обработки данных и построения языковых моделей, говорить не буду, это стало клише, что нужно все больше и больше вычислительных мощностей, а оборудование становится сложнее. С огромным удивлением пролистал множество публикаций про I/O на популярных ресурсах и понял, что часть, связанная с языком, заслужила от силы пару-тройку предложений, словно это нечто неважное. Большинство сделали упор на железо от Google, хотя оно как раз вызывает наименьший интерес в принципе. У всех свои представления о прекрасном, но игнорировать самое сильное направление от Google, где у компании де-факто нет никаких конкурентов? Это как минимум удивительно.
Один из прототипов будущего продукта выглядит как AR-очки, на их небольшой экран выводится в режиме реального времени перевод того, что вам говорят на другом языке. Посмотрите небольшой ролик, описывающий эти возможности.
Новый режим в Google Maps, улучшение Google Lens
В картах от Google для нескольких городов (Лондон, Нью-Йорк, Токио) появится новый режим — Immersive View. Это красивая картинка, которая позволяет не только увидеть фотографии со спутника, но и увидеть нарисованный город, словно 3D-модель, выбрать те места, что вам интересны. На презентации эта возможность выглядела очень красиво.
Дополнительно вы получаете возможность выбрать не просто маршрут, но тот маршрут, что даст наименьший выброс СО2. Для зеленых это просто манна небесная, но большинство людей все же будут ориентироваться на другие параметры — скорость перемещения, цену поездки и так далее. В Google будут добавлять выброс СО2 в разные сервисы, например, в поиск авиабилетов.
В Google Lens можно теперь рассматривать не один предмет, а сразу несколько. Например, вы наводите камеру на полку с шоколадками и тут же видите рейтинг для каждой, описание и так далее. Фактически это визуальный поиск в режиме реального времени. Штука отличная и расширяющая возможности поиска.
Добавим сюда локальный поиск по фотографии, например, когда вы хотите сходить в ресторан и не знаете, куда отправиться, показываете фотографию блюда. И тут же получаете подсказку. Функция получила название «Мультипоиск».
В мультипоиске можно искать по картинке, так, в примере от Google вы делаете фотографию платья, но хотите увидеть его в зеленом цвете. Просто добавляете текстом “зеленый” и видите предложение неподалеку от вас. Хорошая фишка, которая сильно облегчает жизнь.
Железо от Google — смартфоны Pixel 6a/7/7 Pro, наушники Pixel Buds Pro и часы Pixel
Начнем с того, что Google переняла какую-то дурацкую практику — показывать свои устройства задолго до того, как они выйдут на рынок. Нам показали внешний вид Pixel 7/7 Pro, но ничего про модели не рассказали. Странный способ борьбы с утечками, которые постоянно происходят внутри этого подразделения Google.
Давайте посмотрим на Pixel 6a, недорогую версию обычного Pixel 6. В нем убрали 50-мегапиксельную камеру, заменили ее на 12-мегапиксельную. Но и цена вместо 600 долларов стала равной 449 долларам (впрочем, со скидками тот же Pixel 6 можно взять около 500 долларов, и это более выгодное предложение). Учитывая то количество проблем, что есть у аппаратов линейки Pixel, считать их интересным предложением нельзя в принципе, в России они к тому же официально никогда не присутствовали.
Внешность Pixel 6a приятна, но это самый большой плюс аппарата, впрочем, у него наверняка найдутся поклонники, хотя и в небольших количествах. Поклонниками линейки Pixel является небольшое число людей.
Первые часы Pixel Watch стали еще одним самым плохо охраняемым секретом Google, их видели в утечках практически все.
Заочно мне нравится дизайн этих часов, чем-то напоминают Active от Samsung, приятная зализанная форма корпуса. Внутри Wear OS 3, целый ряд мелких улучшений, например, пошаговая навигация в Google Maps (что не так уж нужно в часах). Корпус из нержавеющей стали выглядит тоже достойно. К сожалению, подключить часы к iPhone будет нельзя, в списке поддерживаемых — только Android-смартфоны. Появятся часы только осенью, это еще один ранний анонс.
А еще в Google создают планшет, он появится когда-то в 2023 году. Зачем объявлять свои планы так сильно заранее, непонятно, видимо, чтобы привлечь внимание к утечкам, которые, как пить дать, случатся в самом недалеком будущем.
Осталось сказать про наушники Pixel Buds Pro, в них появилось шумоподавление (лучше поздно, чем никогда!). 21 июля начнутся предзаказы, стоимость наушников — 199 долларов, ничего особенного от них можно не ждать, наушники от Google всегда были средними по возможностям и довольно дорогими. Изначально в них есть поддержка одновременного подключения к двум устройствам, но это нужно проверять на практике, есть подозрение, что за этим скрывается просто быстрое переключение, а не полноценное подключение.
Впечатления от презентации
Знаете, ничего в мире не меняется, Google хороша в поиске, работе с различными языками и построении AI-алгоритмов для этого. Но как только дело касается железа, так все, проклятие сапожника, который сам остается без сапог. Железо, показанное компанией, меня не впечатлило совсем, но понравилось то, что Google делает в поиске, картах и других приложениях, наработки компании выглядят очень многообещающими. Скоро языковые барьеры в нашем мире исчезнут, и это можно только приветствовать.
Из мелочей, на которые почти не обратили внимания, отмечу новую систему безопасности пользователей в Android 13, где можно просматривать результаты поиска по информации о себе и тут же в удобном интерфейсе просить их из этого поиска изъять.
Классная штука, которая понравится многим людям, тем, кто хочет сделать приватной ту или иную информацию о себе, например, скрыть место жительства или что-то иное. Понятно, что Google делает это под давлением законодателей в разных странах, но сам подход в конечном итоге верный.
Как и всегда, I/O про возможности будущего софта и алгоритмов, в меньшей мере про железо. У меня нет разочарования от показанного. Крутейшие штуки, и они поменяют наш мир, в этом нет сомнений. Но яркого шоу, конечно, не было, возможно, что этого не хватает большинству людей. Но нужно ли шоу на конференции для разработчиков? Думаю, что это лишнее и такой подход вреден, все-таки такие мероприятия не для покупателей, а для тех, кто создает технологии.