Table of Contents

Почему именно такая зарплата?

А почему нет! 170 тысяч рублей – это хорошая зарплата, которая позволит увереннее стоять на ногах и спокойнее относиться к новостям о подорожании молока или бензина. Впрочем, попробуйте примерить подобную зарплату к себе. Возможно, она вам подойдет и понравится.

Однако если без шуток, то 170 000 рублей в месяц, или более 2 миллионов рублей в год, – это средняя зарплата специалиста в сфере Data Science с примерно двухлетним опытом.

Так как в сфере Data Science сейчас ощущается кадровый дефицит, то даже специалисты начального уровня с 1 годом опыта получают в среднем 120 тысяч. Однако нельзя останавливаться в начале пути. Так, оклад продвинутых специалистов превышает 250 000 рублей.

Что такое Data Science и Big Data?

С одной стороны, потенциальная зарплата выглядит крайне привлекательно. С другой – сложно претендовать, когда название профессии не слишком объясняет, о чем вообще речь.

Big Data, «биг дата», или большие данные – это огромные массивы данных, которые накапливаются в системах. Причем речь не про межзвездные полеты, а про самые банальные вещи. Например, в продуктовых магазинах каждый день совершаются тысячи покупок, банки каждый день проводят сотни тысяч финансовых транзакций, а на сайтах пользователи совершают миллионы действий. Все эти данные собираются в массивы информации, с которыми надо что-то делать. Ведь в этих данных содержатся полезные инсайты о том, как эффективнее и правильнее вести бизнес.

Специалистов, работающих с Big Data, стали называть data scientists, или дата сайентистами. Это люди, задача которых – проанализировать большие данные, найти в них закономерности и дать ответы на вопросы.

Как дата сайентисты превратились в новую элиту?

Если ещё лет 10 назад все носили на руках программистов и считалось, что только за ними будущее, то сегодня всё изменилось. И человечество относительно близко к тому моменту, когда машины сами себе смогут писать код. А вот вопрос анализа данных, стратегического планирования и придумывания алгоритмов вряд ли когда-то смогут передать в руки искусственного интеллекта. Именно по этой причине Data Scientist’ы превратились в новую элиту. Людей, мыслящих алгоритмами, по-прежнему мало, на них высокий спрос, и получают они больше, чем в среднем по рынку.

Что конкретно может сделать дата сайентист и где он может работать?

Несмотря на сложную англоязычную терминологию, дата сайентисты в целом занимаются простыми и понятными задачами.

Например, сеть кофеен размышляет о том, где открыть новую точку. Раньше подобные решения принимались на основе опыта территориального менеджера или просто наития. Теперь же это работа специалиста по большим данным. Такой специалист возьмет данные по всем кофейням в городе, добавит к этому массиву данных стоимость аренды и информацию про известные пассажиропотоки. Проанализировав эту информацию, он сможет предложить наилучший вариант открытия новой точки.

Ещё распространенный пример – это ассортимент продуктового магазина. На этот факт не все обращают внимание, но в типичном супермаркете у дома от 20 до 50 тысяч товаров. В гипермаркете ассортимент может состоять из 150 тысяч уникальных позиций. И, например, дата сайентист может найти неявные закономерности, предложить идеи расположения товарных групп или от каких товаров можно отказаться, а какую категорию расширить.

Другие примеры – это разработка рекомендательных сервисов, предлагающих интересные для пользователей варианты музыки, фильмов или товаров в интернет-магазине, подборка противников в онлайн-игре, анализ медицинской или банковской базы с тем, чтобы выяснить, кому можно предложить кредит или пригласить на обследование.

Специалисты Data Science сегодня важны практически во всех отраслях. Про сферы бизнеса и банков всё понятно, но, помимо этого, дата сайентисты важны на производстве и в страховых компаниях, чтобы оценивать вероятности поломки оборудования и страховых случаев, в транспортных компаниях для прокладки оптимальных маршрутов, в сельском хозяйстве, чтобы подбирать оптимальные системы землепользования. И даже в метеослужбах современные прогнозы погоды готовят с помощью Data Science. Впрочем, погода пока по-прежнему побеждает всех прогнозистов…

Чтобы работать с большими данными, обязательно быть технарем?

Это один из главных мифов, из-за которого на рынке по-прежнему дефицит кадров. Для желающих стать специалистами по Data Science одним из главных навыков является способность мыслить алгоритмами, то есть придумывать наиболее логичную и правильную последовательность действий для решения той или иной задачи. А языки программирования (в данном случае Python) нужны лишь для того, чтобы облечь мысль в понятный компьютеру код.

К слову, язык программирования Python считается одним из самых легких языков. Python как высокоуровневый язык позволяет оперировать смысловыми командами. То есть вместо досконального прописывания всех переменных и каждого шага, заучивания сложного синтаксиса можно использовать общие команды, понятные по школьному курсу английского, – print, check, type, if, else, except. В результате код Python получается в 3-5 раз короче, чем, например, код С++ или Java. Из-за простоты Python нередко называют языком программирования будущего.

Как долго в мире будет мода на Data Science?

Резонный вопрос. Не хочется потратить время на развитие в профессии, а через пару лет увидеть, что спрос иссяк. В случае с Data Science об этом можно не волноваться. Аналитики считают, что о переходе рынка в зрелую фазу можно будет говорить хорошо, если к 2027 году. Считается, что к этому году начнет спадать кадровый дефицит в развитых странах.

Также важно понимать, что в Data Science есть свои специализации в зависимости от решаемых задач. Например, специалисты начального уровня обычно концентрируются на аналитике данных. При этом можно как сфокусироваться на непосредственном анализе данных, так и стать Data Engineer, который занимается созданием и поддержкой инфраструктуры данных. В какой-то степени востребованность данной профессии можно сравнить с автомеханиками. Автомобили могут быть на двигателе внутреннего сгорания или электричестве, но на техническое обслуживание и ремонт в мастерские им ездить всё равно надо. Так же и со сферой Data Science.

Какими вообще знаниями должен обладать Data Science специалист?

Как уже говорилось выше, изначальный багаж знаний практически неважен. Когда речь идёт о Data Science, то нередко бывает так, что предыдущие (не связанные с «дата сайенс») знания, наоборот, помогут быстрее вникнуть в процесс. Например, если вы раньше работали в продажах и понимаете мотивацию покупателей, то это скорее поможет проанализировать соответствующую базу данных, чем если вы просто хорошо программируете на Python.

Однако если подходить к оценке знаний формально, то состоявшийся Data Science специалист владеет языком программирования Python, знает базы данных и SQL, знает основы алгоритмов и математической статистики.

А что будет после обучения? Кто возьмёт на работу?

После обучения вы сможете составить себе чёткое и понятное резюме, которое вызовет интерес у потенциальных работодателей. В резюме вы сможете написать:

  • Умею программировать на Python
  • Использую библиотеки pandas, numpy, matplotlib, plotly, skleam
  • Пишу сложные SQL-запросы
  • Работаю во фреймворках Hadoop и Spark
  • Умею работать с любой СКВ (GitHub, BitBucket etc)
  • Создаю чат-боты и нейронные сети
  • Понимаю принципы построения инфраструктуры данных
  • Разбираюсь в big data и облачных хранилищах для данных
  • Знаю математическую статистику, теорию вероятности и основные ML алгоритмы
  • Вывожу модели в production
  • Пишу роботов для трейдинга с применением AI
  • Могу предоставить портфолио с наработанными кейсами и проектами