Универсальный переводчик в вашем кармане, время Star Trek настало

Привет.

Вавилонская башня из библейских преданий – первый пример того, как разделяют людей языки. Языковой барьер в повседневной жизни не позволяет получать информацию из первых рук, например, читать периодику на другом языке, смотреть передачи и фильмы. Люди тратят значительную часть своей жизни на то, чтобы учить другие языки, причин для этого множество, и почти всегда это необходимо как для работы, так и для комфортных путешествий. Находиться в другой стране без знания хотя бы английского языка затруднительно, вы испытываете сложности в элементарном общении. Убеждать в этом нашего современника не нужно, владение языками – ключ к новым знаниям и информации, что дает преимущества в различных аспектах. Социологи и экономисты обожают приводить выкладки о том, как меняется среднегодовой доход человека в зависимости от того, какие языки помимо родного он знает. При желании поищите такие исследования, они все примерно об одном.

Мои путешествия начались во времена, когда не было никаких электронных карт, в поездке у вас был бумажный путеводитель с картой, простейшие фразы на другом языке и никакого телефона с собой. Множество курьезных историй случилось тогда, сегодня их невозможно вообразить, так как ваш смартфон позволяет ориентироваться на местности, не требуется знания языка. Появление Google Translate сделало возможным пусть кривое, но общение с местными жителями. Например, теперь на небольшом рынке в Китае можно торговаться, наговаривая текст в телефон, продавец отвечает вам туда же. Языковой барьер ослаб, но вовсе не исчез. На экране вы видите перевод сказанного, можете набрать текст или сказать его.

Идеальным переводчиком может стать система, которая умеет распознавать и переводить текст на лету, без необходимости диктовки. Универсальный переводчик мы видели в Star Trek, идея всегда лежала на поверхности и подкупала простотой. Другой язык не должен быть препятствием для общения, но это всегда оставалось недостижимой мечтой. В ближайшие годы эта мечта будет воплощена в жизнь, это ключевое направление разработок в Google, которое уже приносит свои плоды.

Машинным переводом невозможно кого-то удивить, год к году качество Google Translate, да и большинства конкурирующих продуктов, подрастает. От кривых, косноязычных переводов мы постепенно переходим к текстам, которые можно читать, не спотыкаясь на каждой фразе. Прочитайте вот этот текст: “Ferrari снова обогнала McLaren в борьбе за третье место в чемпионате конструкторов Формулы-1 после того, как оба гонщика финишировали в очках на Гран-при Мехико в воскресенье. С момента старта гонки на 3,5 очка итальянская команда опередила своих британских соперников на 13,5 очка и с большими надеждами удержит преимущество”.

Сказать, что текст невозможно читать, нельзя, есть небольшие придирки с точки зрения литературной составляющей, но большинство новостей и коротких форматов уже вполне подпадают под автоматический перевод. И если вы обратите внимание, то многие сайты устанавливают автоматический перевод на разные языки, чтобы расширить свою аудиторию. Конечно, это ставит под вопрос рынок человеческих переводов, для обычных текстов он грозит сократиться до минимального размера. В то же время профессиональный перевод в области медицины, наук и других специальных областей никуда не исчезнет, специфика будет играть роль еще долгие годы.

Машинный перевод стал первым шагом к тому, чтобы убрать языковой барьер. Обучение алгоритмов качественному переводу дает нам большие массивы данных, каждый год качество перевода будет возрастать и постепенно станет неотличимым от того, как общается большинство людей на другом языке, оперируя ограниченным словарным запасом. Точнее, не так, машинный перевод снимает эти ограничения и дает больший словарный запас, правильно выстроенные грамматические конструкции. Машинный перевод – это база, на которой зиждется все, что происходит с уничтожением языкового барьера.

Голосовые помощники, распознавание речи – это другой огромный пласт наработок, необходимых для общения людей на разных языках. Задача намного сложнее, чем та, что стояла перед машинным переводом, – разный акцент, зачастую искаженная речь и неправильные ударения, дефекты дикции. Но подход ровно тот же – наработать большую базу примеров, научиться распознавать самые сложные слова и фразы, в том числе когда вы говорите на нескольких языках одновременно. Тут Google также имеет огромный задел, голосовые функции на Android одни из самых продвинутых на сегодняшний день. Вы можете, например, записывать интервью на диктофон и тут же получать его расшифровку на экране телефона (то же самое можно сделать для телефонных разговоров). Сторонние компании широко используют распознавание голоса, и почти любой виртуальный секретарь предлагает такую опцию, вы видите голос, преобразованный в текст. Пределов для развития технологии нет даже в рамках существующих алгоритмов, мы увидим развитие этой области в ближайшие десятилетия, все будет становиться лучше и лучше.

То, что Google пытается убрать языковой барьер, вытекает из бизнес-задач компании, это огромный потенциальный рынок, где есть большие деньги. Преуспев в этой задаче, Google одновременно убьет множество рабочих мест по всему миру. Но от этого выиграем мы все, так как языковые барьеры падут.

Давайте взглянем на первые шаги в Android 12, которые позволяют говорить о том, что разработки в этом направлении не просто идут, а уже могут описать недалекое будущее. Посмотрим на такую опцию, как Live Caption, она появилась еще в предыдущих версиях Android, но теперь стала удобнее. Клавиша включения регулировки громкости теперь также получила значок этой опции. Например, вы слушаете подкаст на немецком языке, но не знаете его! Тут же включаются расшифровка голоса и автоматический перевод, окошко висит у вас на экране.

Мы видим совмещение двух технологий, описанных выше, распознавания голоса и машинного перевода, вместе они дают результат, который можно назвать магией. Так как линейка Pixel практически неизвестна на широком рынке, массовый пользователь не может пользоваться этими чудесами. Но в скором времени эта технология станет доступной в массовых устройствах, а значит, получит распространение.

Следующая опция, Live Translate. Это встраивание машинного перевода в чаты, когда вы можете на клавиатуре набирать текст на своем языке, а он тут же будет переведен на другой. Получая сообщение от человека на ином языке, вы тут же получите его перевод (поддерживается даже WhatsApp как стороннее приложение).

Направление, в котором идет развитие этих функций, показывает, что в Google хотят интегрировать перевод во все аспекты Android, сделать его возможным на лету. Например, в беспроводных наушниках Pixel Buds 2 добавили возможность с помощью ассистента переводить распознанный текст на лету. К сожалению, функция была, мягко говоря, сырой, как и все железо, что делает Google. Но идея правильная, и рано или поздно она появится в коммерческих продуктах, горизонт около пяти-шести лет выглядит реальным для интеграции этой возможности в обычные наушники. Причем интеграции на уровне самих наушников, которые смогут осуществлять перевод без участия смартфона как дополнительного устройства.

Вычислительная мощность современных смартфонов и наличие большого объема памяти позволяют реализовать переводы на устройстве, не требуется подключения к сети. Качество таких переводов не уступает тем, что мы видим с использованием облака, как следствие, они становятся все популярнее и популярнее.

У меня нет сомнений, что языковой барьер исчезнет в ближайшее десятилетие. Но это также означает коренные изменения в социальном аспекте. Нам будет проще общаться, но учить языки по старинке будет все меньше людей, армия преподавателей сократится, они просто будут не нужны. Можно представить, что появятся семьи, в которых люди просто не знают языка, на котором говорит их партнер, да это будет и не нужно. Прекрасное время? Возможно. Но урок Вавилонской башни утверждает простую истину, что, потеряв эти технологии, мы можем испытать социальный шок. Привычное общение станет невозможным, мы просто перестанем понимать других людей, которые были наши коллегами, друзьями, близкими. И даже временный сбой в таких технологиях распознавания речи и перевода будет нести нешуточные последствия.

Вы ждете автоматического перевода с голоса для других языков, вам нужна такая технология? И если да, то как планируете использовать в жизни?

[email protected]
наверх