Киборгини: 5 вопросов дата-сайентисту

5 минут Данель Ходжаева
Киборгини: 5 вопросов дата-сайентисту
Партнерский

Киборгини — совместный проект Степи с Halyk Bank. В рамках него мы рассказываем о шести девушках, которые вместе с большим банковским блоком стоят за развитием IT-индустрии Казахстана, кодят и программируют по будням, а в свободное время ломают стереотипы общества об образе жизни айтишниц.

Наша шестая героиня — главный Data Scientist Жазира Шайхиева. Она работает с большим объемом информации в рамках проекта банка «Фабрика данных», а свободное время посвящает саморазвитию: занимается спортом, кройкой и шитьем и осваивает IT-навыки.


«Я стараюсь проводить все свободное время максимально продуктивно, чтобы не упустить ничего. Бывает, что из-за такого загруженного графика сильно устаю, но путешествия всегда помогают восстанавливать силы», — рассказывает девушка. 

Что такое Data Science?

Data Science — это работа с большим объемом данных. Обычно IT-специалисты получают их в виде неструктурированной информации, которую необходимо обработать, провести анализ и построить математическую модель. В результате модель помогает составить определенный прогноз для бизнеса и решить необходимую задачу.

Например, какие предложения являются наиболее востребованными, на какие объявления чаще откликаются или даже то, как правильно выстроить ленту рекомендаций в YouTube или TikTok. Та же таргетированная реклама основана на моделях, которые разрабатывают дата-сайентисты. Учитывая то, что любой бизнес нуждается в прогнозах и оценках для действующих и будущих проектов, Data Science становится актуальнее с каждым днем.

Зачем компании дата-сайентисты?

В дата-сайентистах нуждается любая корпорация или крупная компания, которая сталкивается с большим объемом данных или внушительной клиентской базой. К основным направлениям можно отнести следующие сферы:

  • банковский сектор;
  • медицинские учреждения;
  • страховые компании;
  • крупные IT-компании;
  • логистика.

Несмотря на это, полноценный список сфер представить невозможно, потому что с развитием технологий и искусственного интеллекта даже маленькие компании стали прибегать к услугам дата-сайентистов. В основе работы Data Science находится анализ данных, который помогает найти определенные закономерности и выстроить рекомендации. Эти рекомендации могут помочь бизнесу в том, чтобы улучшить свои сервисы, понять, что именно интересует их клиентов и какие техники лучше применить для оптимизации процессов. 

Какие навыки нужны для этой профессии?

У меня с детства была склонность к математике и информатике. В школе всегда участвовала в различных конкурсах и олимпиадах, где получала призовые места. В старших классах уже точно знала, что буду заниматься программированием, поэтому решила поступить на факультет мехмата. Все эти знания пригодились мне в сфере Data Science, потому что работа построена на работе с цифрами и информацией.

Если говорить о базовых навыках, то дата-сайентисту нужно знать математику, математическую статистику, принципы машинного обучения и основной язык программирования.

К дополнительным навыкам можно отнести умение визуализировать данные и способность работать в команде. Визуализация нужна для того, чтобы работать с огромным объемом данных и на основе них наглядно составлять прогнозы и объяснять их. Умение работать в команде и коммуникативные тоже очень важны, потому что деятельность дата-сайентиста может быть тесно связана с другими IT-специалистами. Необходимо быть динамичным и постоянно совершенствоваться: Data Science развивается с каждым днем, поэтому всегда нужно дорабатывать или оптимизировать процессы.

К базовым языкам дата-сайентиста можно отнести Python и SQL. Сначала мы собираем информацию в базу данных. Далее с помощью Python создаем модель, которая считывает информацию и выводит результат. На основе него мы и строим прогноз.

Как Data Science применяют в банках?

В банках существует большая клиентская база. Она требует анализа для того, чтобы улучшить работу сервиса и разработать новые предложения для клиентов. Кроме того, Data Science в банке анализирует различные финансовые операции клиента, которые помогают определить, стоит ли выдавать кредит тому или иному человеку. 

В Halyk Bank существует отдельный департамент дата-сайентистов. Он разделяется на две категории: по работе юридическими и физическими лицами. Розничный, в котором состоит наша команда, работает над улучшением клиентских сервисов. С помощью машинного обучения мы разделяем клиентов на определенные категории, определяя, кто из них наиболее активен, а кто находится под риском ухода. С учетом этих прогнозов составляем индивидуальные предложения, которые затем приходят в виде уведомлений, пушей и сообщения. 

Сейчас мы реализуем большой проект «Фабрика данных», который ориентирован на развитие Data Science в банке. Мы проводим много времени за анализом данных о клиентах, чтобы найти закономерности и улучшить продукты банка. 

«Фабрика данных» — это огромный проект, в котором участвуют дата-сайентисты, разработчики, дата-инженеры и представители бизнеса. Это командная работа не только внутри департамента, но и с другими IT-специалистами. Сначала мы получаем большие объемы информации, затем создаем алгоритмы и модели, а после тестируем и проверяем гипотезы. Если в банке не было бы дата-сайентистов, то клиенты получали бы довольно сырые предложения, которые лишены индивидуального подхода. 

С чего нужно начать начинающему специалисту?

Можно сказать, что дата-сайентист частично выполняет функции дата-аналитика и дата-инженера. Его основная цель — найти среди массы данных закономерности, которые в будущем приведут к лучшему результату. Несмотря на то, что это очень актуальная профессия, на рынке Казахстана существует нехватка специалистов. Сегодня вузы пока не готовят дата-сайентистов, поэтому часто ими становятся IT-специалисты с хорошим знанием высшей математики. 

Наверное, гуманитариям в этой среде придется не так просто, но все зависит от усилий и заинтересованности. В целом можно отметить, что начинающий дата-сайентист должен учиться следующему:

  • работать с большим объемом данных;
  • уметь визуализировать данные и просто объяснять их;
  • знать принципы машинного обучения;
  • владеть языком программирования, чаще — Python;
  • обладать коммуникативными навыками.

Еще много интересного

Статьи STEPPE

Canon EOS R1 и EOS R5 Mark II: тест драйв новинок на гоночной трассе в Австрии

Canon EOS R1 и EOS R5 Mark II: тест драйв новинок на гоночной трассе в Австрии

В начале сентября на легендарной трассе Red Bull Ring в Австрии прошла презентация новейших продуктов компании Canon — камер...

5 минут
5 минут
«Моему дяде Чикко я обязана тем, что он сделал меня мечтательницей»: интервью с племянницей Федерико Феллини

«Моему дяде Чикко я обязана тем, что он сделал меня мечтательницей»: интервью с племянницей Федерико Феллини

В Алматы открылась фотовыставка, посвященная 100-летию со дня рождения Марчелло Мастроянни — иконы итальянского кино...

4 минуты
4 минуты
Что может случиться с озером Балхаш: интервью с кураторкой выставки «Переплетая Климат, Воды и Сообщества»

Что может случиться с озером Балхаш: интервью с кураторкой выставки «Переплетая Климат, Воды и Сообщества»

27 сентября состоялось открытие выставки «Переплетая Климат, Воды и Сообщества». Изначально выставка была представлена в...

13 минут
13 минут
Как креатору облегчить себе жизнь

Как креатору облегчить себе жизнь

LENOVO YOGA SLIM 7X: превосходный выбор для создателей...

13 минут
13 минут