Gemini – все, что нужно знать про ИИ от Google

Примечание редакции Mobile-review.com. Мы подбираем материалы в раздел «Мнение», чтобы показать то, как воспринимают рынок компании в других странах. Мнения в таких материалах зачастую не совпадают со взглядами нашей редакции, но дают понимание рынка, его медийной составляющей.

По материалам Android Central

Gemini от Google — это чат-бот с генеративным искусственным интеллектом и большой языковой моделью (LLM), ранее известный как Google Bard. Gemini AI может генерировать истории по запросам, предлагать решения проблем с написанием кода, искать информацию по загруженному изображению или предоставлять вам контекстную информацию на основе вашего местоположения или данных из других приложений Google.

На конференции Google I/O 2024 компания уделила много времени рассказу о своих планах на будущее в области искусственного интеллекта, включая несколько новых версий и обновлений Gemini. На данный момент это не только Gemini, а еще и Gemini Nano, Flash, Pro, Advanced, Live, приложение Android Gemini и несколько других версий. Не говоря уже о других проектах Google AI, связанных с Gemini AI, таких как Google AI Studio, Gemma и Project Astra. Можно запутаться, так что давайте разбираться.

Как работает Google Gemini

Google Gemini, как и поиск Google, отвечает на ваши вопросы, извлекая ответы из интернет-источников. Разница в том, что Gemini пытается оформлять свои собственные ответы вместо того, чтобы подсвечивать сторонние источники.

Используя языковую модель диалоговых приложений Google (LaMDA) и модель машинного обучения с открытым исходным кодом Transformer, Gemini «прочитывает» триллионы слов из каждого общедоступного источника, а затем использует их для имитации человеческих ответов, переписывая информацию из Интернета.

Когда вы видите Gemini AI Overview в результатах поиска, ИИ обобщает данные из нескольких источников с высоким рейтингом, а ссылки показываются, если нажать «Показать больше». Но на самом деле ИИ не может определить, достоверны ли эти источники. Вот почему иногда можно получить неправильные ответы, основанные на данных юмористических сайтов или троллинге в комментариях на Reddit.

Качество ответа Gemini AI также будет зависеть от того, какую версию Gemini вы используете.

Откуда взялись «Близнецы»?

Google назвала свой ИИ Bard, а затем поменяла название на Gemini. Латинское слово Gemini означает «Близнецы», и это, как известно, зодиакальное созвездие с двойными звездами. Это также название изначальной программы НАСА по запуску на Луну, предшествующей знаменитым миссиям «Аполлон», связанное с тем, что в космическом корабле Gemini могли разместиться двое.

Согласно сообщению в блоге Google, название Gemini AI получилось, потому что два отдела Google (DeepMind и команда Google Research Brain) объединились ради проекта, а также потому, что «огромные усилия по обучению больших языковых моделей напоминали об атмосфере при запуске ракет».

Bard не упоминается в посте, поэтому, если отбросить поиски глубинного смысла, Gemini, вероятно, звучит более футуристично и коммерчески привлекательно, чем Bard.

Версии и ответвления Google Gemini

Перечислим различные версии Google Gemini, чтобы вы могли представить всю картину:

Gemini Nano. Предназначен для приложений для смартфонов, которые работают на устройстве с использованием нейронного процессора (NPU) без необходимости подключения к сети. Gemini Nano доступен на таких телефонах, как Pixel 8 Pro, на его основе работают функции, анонсированные в декабре 2023 года, такие как умные ответы в WhatsApp или инструмент создания сводки в приложении «Диктофон».

Gemini 1.5 Pro. Стандартный Gemini с контекстным окном в 1 миллион токенов (это означает, что он может одновременно обрабатывать большие объемы текста, кода, аудио или видео для одного запроса). В настоящее время разработчики могут попробовать Pro-версию с контекстом в 2 миллиона токенов. Gemini Pro — это то, что такие компании, как Samsung, используют для добавления Gemini AI в свои приложения, например, заметки, диктофон или клавиатуру Samsung.

Gemini 1.5 Flash. Эта версия использует тот же стандарт в 1 миллион, что и 1.5 Pro, но она «оптимизирована для более узких или высокочастотных задач, где скорость отклика модели имеет наибольшее значение». Как и Pro, он доступен разработчикам через Gemini API.

Gemini Advanced. Это подписка Google для пользователей Google One, дающая доступ к инструментам искусственного интеллекта. Она использует Gemini 1.5 Pro и его контекстное окно на 1 миллион токенов, поэтому не является более продвинутой версией для умных. Тем не менее, вам предоставляется ряд инструментов, таких как сводки в документах и таблицах Google, общение с ассистентом Gemini Live и кастомизированные версии Gemini под названием Gems.

Gemini Live. Появится в Gemini Advanced в конце этого года, представляет собой просто голосовую версию Gemini Pro, которая позволяет вам общаться с чат-ботом с искусственным интеллектом как с голосовым ассистентом на вашем Android-смартфоне. Вы сможете выбрать один из 10 различных голосов и «прервать ответ уточняющими вопросами», если захотите.

Gems. Еще одна будущая функция для подписчиков Gemini Advanced. Gems — это кастомизированные версии Gemini, которые вы создаете в соответствии со своими собственными потребностями. Вы можете задать такие параметры, как «ты мой тренер по бегу, выдай мне ежедневный план тренировок и будь позитивным, оптимистичным и мотивирующим», а затем поговорить с ИИ в соответствующем ключе.

Gemma. Это открытое ИИ-ответвление Gemini от Google. Различные сборки Gemma «имеют те же технические и инфраструктурные компоненты», что и Gemini, за исключением того, что разработчики могут использовать код для создания своих собственных проектов ИИ. Конкретные варианты, такие как CodeGemma (для программистов) и RecurrentGemma (для исследователей), являются более специализированными, в то время как Gemma 2 – более общее обновление для интеллектуальных функций.

Vertix AI. Платформа для разработки ИИ, которая включает в себя как Gemini 1.5 Flash, так и 1.5 Pro, а также 150+ других «базовых моделей» ИИ.

Imagen. Показанная на Google I/O 2024, Imagen 3 представляет собой модель преобразования текста в изображение, которая, по словам Google, появится в веб-версиях и приложениях Gemini в будущем. Она может создавать фотореалистичные изображения на основе текстовых подсказок, как на картинке ниже. На данный момент можно записаться в лист ожидания, чтобы ее опробовать.

Изображение, сгенерированное Imagen 3 

Вео. Модель преобразования текста в видео от Google, которая «генерирует высококачественные видео с разрешением 1080p длительностью более минуты в широком диапазоне кинематографических и визуальных стилей». Он появится в инструменте VideoFX и YouTube Shorts и построен на нескольких моделях искусственного интеллекта (включая Gemini).

Project Astra. Gemini 1.5 Pro может работать с мультимедиа, но в основном предназначен для обработки одного запроса за раз. Project Astra — это мультимодальный ИИ, который может ответить на контекстуальный вопрос, например, «На что я смотрю?», на основе визуальных данных. Эта технология может помочь в создании будущих очков Google AR. Команда DeepMind говорит, что Astra «основана на наших моделях Gemini», и некоторые функции могут появиться в приложении Gemini AI во второй половине 2024 года.

Google AI Studio. На специальном сайте вы можете начать работу над проектами Gemini с доступным API Gemini и такими инструментами, как код Cookbook и подсказки, которые вам помогут.

Где доступен Google Gemini?

Стандартная версия Google Gemini AI «в настоящее время доступна более чем на 40 языках и в более чем 230 странах и территориях», согласно странице поддержки Google. После того, как Google привезла Gemini в Канаду после юридической задержки, осталось очень мало мест, где не поддерживается Gemini AI.

Мобильное приложение Gemini несколько более ограничено. На странице «Доступность поддержки» в настоящее время отображается 19 языков и «более 150 стран» (России в их списке нет).

В любом случае вам нужна законная учетная запись Google, чтобы получить доступ, как упоминалось выше. Вам должно быть не менее 18 лет в Европейской экономической зоне (ЕЭЗ), Канаде, Швейцарии или Великобритании. В других регионах вам должно быть не менее 13 лет (или 14–17 лет в некоторых странах) с аккаунтом без ограничений.

Как получить доступ?

Если проект доступен в вашей стране, то нужно просто перейти на страницу сервиса, чтобы получить доступ к генеративному ИИ на любом устройстве, на всех доступных языках и во всех странах (подробнее об этом позже).

Если ваш аккаунт Google управляется в Family Link, Google Workspace for Education или в Workspace, где администратор не включил Gemini, вы не сможете получить доступ к этому инструменту. Для его работы необходима действующая учетная запись Google.

Хотя некоторые инструменты Gemini являются эксклюзивными для Pixel 8, вы можете загрузить приложение Google Gemini для Android, чтобы получить доступ к ИИ напрямую на большинстве Android-смартфонов, работающих на Android 10 или более поздней версии. К сожалению, некоторые Android-смартфоны не позволяют установить Gemini, например, Motorola Razr. Google говорит, что «мы работаем над этим и стремимся сделать его доступным в ближайшее время».

На iPhone и iPad можно получить доступ к Gemini AI через стандартное приложение Google.

Модели Chromebook Plus получат функции Gemini в обновлении за июнь 2024 года, в том числе Help Me Write, Generative AI Wallpaper и Video Call Backgrounds, а также Magic Editor в Google Фото.

Наконец, можно управлять расширениями Gemini в других приложениях Google, таких как Карты, Отели, Авиабилеты, YouTube, YouTube Music и Workspace. Эта страница управления Gemini Extensions позволяет включать и выключать его в определенных приложениях по необходимости.

Стоимость Gemini Advanced

Google предоставляет Gemini Advanced только в тарифном плане Google One AI Premium за $19,99, хотя вы можете получить два бесплатных месяца обслуживания, прежде чем его купить.

Вы не можете оплатить Gemini Advanced отдельно. Подписчики Google One Premium ($9,99 в месяц) должны платить двойную цену за Gemini Advanced. Вы получите все стандартные привилегии Premium, такие как 2 ТБ места в хранилище, Google VPN и инструменты ИИ в приложении «Фото», такие как Magic Eraser.

А если оформить подписку на тарифный план Google One AI Premium Family, доступ к ИИ получит только пользователь основного аккаунта. Все остальные члены семьи получают только дополнительное место для хранения данных и расширенные инструменты редактирования фотографий.

В конечном счете выбор, платить ли за Gemini Advanced, будет зависеть от того, будет ли он использоваться для повседневных, профессиональных или учебных целей. Стандартные ответы Gemini AI можно получить в приложении бесплатно, а Advanced предоставляет более продвинутые инструменты.

Полемика вокруг Google Gemini и Bard

Начало пути Google Bard вышло тернистым и противоречивым. Несмотря на то, что ребрендинг Gemini AI призван убрать негативные моменты, он также не лишен противоречий.

Когда Google Bard был впервые показан, он дал неправильный ответ на вопрос, что побудило некоторых сотрудников заявить, что он был выпущен в спешке.

Еще один спорный момент возник, когда бывший инженер Google Джейкоб Девлин заявил, что Google обучила Bard на ShareGPT, форуме, где люди постят ответы ИИ. А источник внутри компании утверждал, что Google прекратила это делать только после того, как Девлин раскритиковал эту практику.

Сама Google говорит, что «Bard не обучен на каких-либо данных из ShareGPT или ChatGPT», поэтому мы не можем быть уверены, правда это или нет.

После запуска Bard «крестный отец ИИ» ушел в отставку, отметив опасность ИИ из-за распространения дезинформации и отнятия у людей рабочих мест. В прошлом году Google уволила десятки тысяч сотрудников и сослалась на политику в области искусственного интеллекта, оправдывая свои недавние увольнения в инженерных отделах и отделах продаж рекламы.

Позже выяснилось, что люди, которым поручено обучать и совершенствовать Bard, работают в условиях стресса и им дается всего три минуты, чтобы определить, насколько точен ответ, в то время как он может потребовать более серьезного рассмотрения.

Самая недавняя проблема, связанная с Gemini, заключается в том, что Google заменяет им Ассистента. Пользователи Gemini для Android раскритиковали отсутствующие функции, такие как подкасты, рутины и напоминания. Руководитель проекта Gemini Джек Кравчик (Jack Krawczyk) также указал на такие проблемы, как «нравоучительная дистанция» и необходимость в интерпретации для понимания ответов, касающихся кода. Конечно, такого рода проблем можно ожидать при большом запуске ПО. Вопрос в том, как быстро Google их устранит.

[email protected]
наверх