Разобраться с «датой»: как освоить главную профессию будущего

18 минут Айнур Смаилова
Альтернативный текст

Данные (англ. data) в наше время признаны «новой нефтью»: в сыром и необработанном виде большие объемы информации так же как и нефть бесполезны.

C развитием цифровой экономики возрос спрос на специалистов, умеющих анализировать сложные и зачастую неструктурированные данные. Выросла привлекательность (читайте —сексуальность) дата-сайентистов и аналитиков данных.

В этом материале разберемся:

Почему эта профессия стала настолько востребованной в последнее десятилетие

Кто может стать дата-сайентистом

Сколько получают аналитики данных в Казахстане

Сколько получают специалисты по data science и аналитики данных за границей

Есть ли риски у данной профессии

Где можно работать дата-сайентистом в Казахстане

К чему следует быть готовым, если вы решили «уйти в дату»

С чего следует начать

Почему эта профессия стала настолько востребованной в последнее десятилетие?

Согласно статистике, представленной на Всемирном Экономическом Форуме в 2020 году, количество цифровых данных на начало этого года составляло 44 зеттабайта (в числе 1 зеттабайт 21 ноль).

Например, одних только имейлов в 2019 году было отправлено 188 миллионов штук в секунду. Объем данных на ближайшие годы был также спрогнозирован:

Очевидно, что для управления всеми этими данными нужны будут профессиональные кадры. Более того, по мнению Линды Берч, директора фирмы по найму персонала для руководящих позиций в США, основными инструментами науки о данных должны будут в скором времени владеть все, в особенности кандидаты на подобные должности группы C (CEO, CFO, CIO).

Кто может стать дата-сайентистом?

Первый стереотип, который отталкивает при мысли о смене карьеры, это обязательное для аналитиков данных знание математики и ее принципов. Соответственно, в голове возникают мысли о том, что математику я изучал давно и было это еще в школьные времена.

Подобные сомнения у многих возникают при не самых приятных воспоминаниях о школьных уроках алгебры и геометрии. Однако ваши неудачи в школе говорят только о неуспешной сдаче одного предмета, а не о ваших ментальных способностях.

Наука о данных — это о практическом применении математики и статистики. В наше время доступного онлайн образования можно найти курс, подходящий именно вам, освежить знания или даже освоить новые (список курсов приводим ниже).

Второй фактор, который часто смущает — возраст. Сомнения вроде того, что вы уже слишком стары и перспективы есть только у молодежи, одолевают многих. Тем не менее, для успешной работы дата-сайентистом недостаточно быть просто технически образованным.

Знания работы бизнеса или любой сферы деятельности, где планируется применять анализ данных, не менее важны. Вы должны понимать, с какой целью будет проведен анализ данных, какие сферы нужно оптимизировать или улучшить. У молодежи очень часто не хватает именно практического опыта, поэтому в данной сфере возраст, а, соответственно, и опыт только в плюс.

В качестве доказательства ниже приведен один из результатов опроса, проведенного Kolesa Group среди казахстанских аналитиков и data science-специалистов в ноябре 2019 года, наглядно отразивший предыдущий опыт работы участников. Согласно опросу, более половины респондентов пришли в аналитику и Data Science из менеджмента, экономики, продаж, маркетинга и других нетехнических дисциплин.

Принято думать, что сфера IT-технологий преимущественно для мужчин. Статистика подтверждает: в мире всего 17% IT специалистов – женщины. Тем не менее растет спрос на программирование, так, в Казахстане в 2019 объем услуг в этой сфере вырос на 46%. Соответственно, увеличивается и количество девушек, изучающих технические специальности.

По данным исследования Stack Overflow, проведенного Developer Survey Results в 2019 году, доля женщин в программировании увеличилась с 9% до 11% в 2019 году. В науке о данных женщины занимают 26%.

В Казахстане девушки в IT составляют всего 14%. Чтобы помочь девушкам войти в IT, создаются благотворительные инициативы по поддержке девушек вроде STEM bootcamp при American Space Corner в Алматы, чьи лекции выкладываются на YouTube и доступны всем. Также существуют благотворительные наборы для девушек на Power BI-курс Екатерины Рехерт, одной из самых известных представительниц науки о данных в стране, где в июле 2020 года 35 девушек отучились бесплатно.

Женских имен в аналитике данных в Казахстане, конечно, намного больше. Например, Тогжан Султан, которая окончила факультет экономики в Назарбаев Университете, решила поменять специальность на data science и поступила в Колумбийский университет, а сейчас работает data scientist в Нью-Йорке; Айгерим Сагындыкова — экс-team lead в Kaspi Bank, работала полгода в Силиконовой Долине; Назым Сатбекова — Machine Learning инженер в Kolesa Group; Баян Асенова — data scientist в Kolesa Group.

Сколько получают аналитики данных в Казахстане?

Заработная плата существенно растет вместе с опытом работы: так, начинающий специалист со стажем работы в 1 год будет получать оклад в размере около 230 тысяч тенге, уже через год оплата труда того же специалиста возрастет до 400 тысяч тенге. Специалисты со стажем от трех лет уже считаются опытными сотрудниками и их средняя зарплата составляет от 550 тысяч тенге.

Также необходимо отметить, что оплата труда более редких специалистов, таких как DWH- разработчиков (data warehouse — хранилище данных) или ML- инженеров (machine learning — машинное обучение) может отличаться.

Например, в то время как средняя зарплата product и marketing аналитиков составляет 400-450 тысяч тенге, зарплаты ML и DWH инженеров составляют 500-540 тысяч тенге.

Сколько получают специалисты по data science и аналитики данных за границей?

Согласно отчету сайта Glassdoor? на конец октября 2020 года средняя зарплата специалиста по data science в США составляет 113 000 долларов или около 48,9 млн тенге в год, а у аналитика данных – 62 000 долларов или около 26,8 млн тенге в год.

Разница в оплате труда объясняется тем, что в зарубежных компаниях аналитик данных зачастую выполняет основной сбор и анализ информации, прогнозом же и стратегией работы с данными занимается data scientist, и, соответственно, его работа оплачивается выше.

Третье направление — инженеры данных (DWH, ML– специалисты) — работают с базами данных и системами обработки. В Казахстане, а также странах СНГ различия между тремя специальностями довольно размыты, так как рынок труда для специалистов по работе с данными находится в стадии развития и большинству компаний требуются наборы навыков, соответствующие всем трем специальностям.

В Москве зарплата начинающего специалиста составляет от 60 000 рублей или около 334 000 тенге в месяц, тогда как сотрудник с хорошим опытом получает в среднем 134 000 рублей или около 747 000 тенге в месяц.

Есть ли риски у данной профессии?

Как мы уже говорили, большую часть времени дата-сайентист проводит за трансформированием сырых данных. Процесс этот может быть долгим, так как необходима проверка каждой гипотезы и модели. Соответственно, основным риском в данной работе является неопределенность в результате. Также недостаточность знаний специалиста может затруднить решение проблемы. Поэтому постоянное обучение крайне необходимо для этой профессии.

Где можно работать дата-сайентистом в Казахстане?

Заметьте, что в сфере IT работают только 40% специалистов, 25% работают в сфере финансов, остальные индустрии, такие как ретейл, сотовая связь и телекоммуникации и прочие также внедряют анализ данных в свою работу.

По данным на 28 октября 2020 года, на сайте hh.kz было размещено около ста вакансий для специалистов по работе с данными. Половина из них требуются в IT и телеком-компании, 15 вакансий было размещено банками и еще столько же специалистов требуются в отделы маркетинга, остальные специалисты требовались в сферах бухгалтерии, продаж, консультирования и других.

К чему следует быть готовым, если вы решили «уйти в дату»?

Одним из самых важных навыков для этой профессии является способность и любовь к постоянному обучению. Технологии не стоят на месте. Данные растут с каждым годом с невероятной скоростью. Поэтому будьте готовы к непрерывному обучению, благо, что доступных курсов в сети достаточно.

Помимо этого, для работы аналитиком данных важны такие личные качества, как любовь к деталям и усидчивость, так как большую часть рабочего времени вам будет необходимо трансформировать сырые данные в ваших руках до тех пор, пока это не даст вам желаемый результат.

С чего следует начать?

Начать можно с поиска интересующей вас темы в интернете и изучения ее онлайн или офлайн. Например, пройти онлайн-курсы ведущих университетов мира на сайтах Coursera, Udemy, Datacamp (можно начать со статистики, SQL, языков программирования Python и R).

  1. Онлайн курс по основам программирования на языке R от профессора Гарварда Курс бесплатный (за официальный сертификат необходимо будет доплатить 49$) и очень популярный (более 500 тысяч человек прошли этот курс). Язык обучения – английский.
  2. Курс по SQL для начинающих

    Стоимость курса —около 12 долларов — включает в себя, помимо курсов, сертификат, а также пожизненный доступ к материалам курса. Количество прослушавших курс студентов — 82 510. Язык обучения — английский.
  3. Специализация Data Science от Johns Hopkins University на Coursera

    Специализация включает в себя 10 курсов, которые можно пройти как по отдельности, так и все вместе. Есть бесплатный 7-дневный доступ, после чего стоимость будет составлять 50 долларов в месяц. Прохождение всех 10 курсов займет около 11 месяцев. По окончании платного курса, вы получаете сертификат, которым можно поделиться в вашем профиле в LinkedIn. Язык обучения — английский, есть русские субтитры.
  4. Курс по основам математики для профессии Data Scientist от Duke

    Уровень обучения — начальный, длительность составит около 13 часов. Курс будет полезен как раз тем, кто хотел освежить знания в математике. На этот курс также есть бесплатный 7-дневный доступ, после чего стоимость будет составлять 50 долларов в месяц. По окончании платного курса вы получаете сертификат, которым можно поделиться в вашем профиле в LinkedIn. Язык обучения — английский, есть русские субтитры.
  5. Data Science для всех — курс на Datacamp — включает в себя один короткий бесплатный курс «Введение в Data Science», где можно ознакомиться с профессией, с разными ролями в ней и инструментами и уже определиться с дальнейшим обучением. Продолжить обучение можно платно, доступны различные тарифы. Язык обучения — английский.

    А практиковать знания можно, участвуя в соревнованиях на Kaggle.com.

Казахстанские компании также устраивают обучающие курсы с целью «воспитать собственные кадры»:

Alfa Data School — инициатива от Альфа-банка по обучению специалистов по анализу данных. Студенты обучаются по трем направлениям — ввод в анализ данных, дата-инженеры и дата-scientists, а по окончании курса защищают реальную бизнес-задачу банка. Лучшие выпускники получают предложение о работе.

— Для сторонников классического очного образования есть хорошие новости — специальность data science относительно недавно появилась в крупных казахстанских университетах, таких как МУИТ, Astana IT и AlmaU.

Если вам покажется, что нет смысла начинать изучать программирование или статистику сейчас, так как уже существуют сотни специалистов, вы ошибаетесь. Наука о данных относительно молода не только в Казахстане, но и во всем мире.

Тем не менее, 90% всех данных создаются в последние 2 года и инструменты науки о данных так же стремительно развиваются. Поэтому, если вы твердо решили менять карьеру, то вполне возможно, что через 5 лет уже именно вы станете тем самым опытным профессионалом.

Статьи STEPPE

Подборка стипендий, международных конкурсов и бесплатных онлайн-курсов

Стипендия для женщин в компьютерных науках, курс по разработке веб-страниц и конкурс дизайнеров от Lexus — подробности в новом материале.

10 минут
10 минут

«Не существует в базе данных»: как живут бездомные в Центре социальной адаптации в Алматы

Рассказываем истории людей, оказавшихся в алматинском Центре социальной адаптации.

13 минут
13 минут

Что происходит с современной литературой Казахстана?

Современная казахстанская литература проходит процесс трансформации. Каждый год выходят книги, их авторы получают литературные премии — правда, чаще в соседней России. На родине о них знают преступно мало, поэтому спешим исправить ситуацию.

27 минут
27 минут

5 идей интересных социальных проектов

Финалисты Idea Challenge 2020 рассказали о своих идеях, которые смогут сделать наш мир чуточку лучше.

9 минут
9 минут