Киборгини: 5 вопросов дата-сайентисту

5 минут Данель Ходжаева
Киборгини: 5 вопросов дата-сайентисту
Партнерский

Киборгини — совместный проект Степи с Halyk Bank. В рамках него мы рассказываем о шести девушках, которые вместе с большим банковским блоком стоят за развитием IT-индустрии Казахстана, кодят и программируют по будням, а в свободное время ломают стереотипы общества об образе жизни айтишниц.

Наша шестая героиня — главный Data Scientist Жазира Шайхиева. Она работает с большим объемом информации в рамках проекта банка «Фабрика данных», а свободное время посвящает саморазвитию: занимается спортом, кройкой и шитьем и осваивает IT-навыки.


«Я стараюсь проводить все свободное время максимально продуктивно, чтобы не упустить ничего. Бывает, что из-за такого загруженного графика сильно устаю, но путешествия всегда помогают восстанавливать силы», — рассказывает девушка. 

Что такое Data Science?

Data Science — это работа с большим объемом данных. Обычно IT-специалисты получают их в виде неструктурированной информации, которую необходимо обработать, провести анализ и построить математическую модель. В результате модель помогает составить определенный прогноз для бизнеса и решить необходимую задачу.

Например, какие предложения являются наиболее востребованными, на какие объявления чаще откликаются или даже то, как правильно выстроить ленту рекомендаций в YouTube или TikTok. Та же таргетированная реклама основана на моделях, которые разрабатывают дата-сайентисты. Учитывая то, что любой бизнес нуждается в прогнозах и оценках для действующих и будущих проектов, Data Science становится актуальнее с каждым днем.

Зачем компании дата-сайентисты?

В дата-сайентистах нуждается любая корпорация или крупная компания, которая сталкивается с большим объемом данных или внушительной клиентской базой. К основным направлениям можно отнести следующие сферы:

  • банковский сектор;
  • медицинские учреждения;
  • страховые компании;
  • крупные IT-компании;
  • логистика.

Несмотря на это, полноценный список сфер представить невозможно, потому что с развитием технологий и искусственного интеллекта даже маленькие компании стали прибегать к услугам дата-сайентистов. В основе работы Data Science находится анализ данных, который помогает найти определенные закономерности и выстроить рекомендации. Эти рекомендации могут помочь бизнесу в том, чтобы улучшить свои сервисы, понять, что именно интересует их клиентов и какие техники лучше применить для оптимизации процессов. 

Какие навыки нужны для этой профессии?

У меня с детства была склонность к математике и информатике. В школе всегда участвовала в различных конкурсах и олимпиадах, где получала призовые места. В старших классах уже точно знала, что буду заниматься программированием, поэтому решила поступить на факультет мехмата. Все эти знания пригодились мне в сфере Data Science, потому что работа построена на работе с цифрами и информацией.

Если говорить о базовых навыках, то дата-сайентисту нужно знать математику, математическую статистику, принципы машинного обучения и основной язык программирования.

К дополнительным навыкам можно отнести умение визуализировать данные и способность работать в команде. Визуализация нужна для того, чтобы работать с огромным объемом данных и на основе них наглядно составлять прогнозы и объяснять их. Умение работать в команде и коммуникативные тоже очень важны, потому что деятельность дата-сайентиста может быть тесно связана с другими IT-специалистами. Необходимо быть динамичным и постоянно совершенствоваться: Data Science развивается с каждым днем, поэтому всегда нужно дорабатывать или оптимизировать процессы.

К базовым языкам дата-сайентиста можно отнести Python и SQL. Сначала мы собираем информацию в базу данных. Далее с помощью Python создаем модель, которая считывает информацию и выводит результат. На основе него мы и строим прогноз.

Как Data Science применяют в банках?

В банках существует большая клиентская база. Она требует анализа для того, чтобы улучшить работу сервиса и разработать новые предложения для клиентов. Кроме того, Data Science в банке анализирует различные финансовые операции клиента, которые помогают определить, стоит ли выдавать кредит тому или иному человеку. 

В Halyk Bank существует отдельный департамент дата-сайентистов. Он разделяется на две категории: по работе юридическими и физическими лицами. Розничный, в котором состоит наша команда, работает над улучшением клиентских сервисов. С помощью машинного обучения мы разделяем клиентов на определенные категории, определяя, кто из них наиболее активен, а кто находится под риском ухода. С учетом этих прогнозов составляем индивидуальные предложения, которые затем приходят в виде уведомлений, пушей и сообщения. 

Сейчас мы реализуем большой проект «Фабрика данных», который ориентирован на развитие Data Science в банке. Мы проводим много времени за анализом данных о клиентах, чтобы найти закономерности и улучшить продукты банка. 

«Фабрика данных» — это огромный проект, в котором участвуют дата-сайентисты, разработчики, дата-инженеры и представители бизнеса. Это командная работа не только внутри департамента, но и с другими IT-специалистами. Сначала мы получаем большие объемы информации, затем создаем алгоритмы и модели, а после тестируем и проверяем гипотезы. Если в банке не было бы дата-сайентистов, то клиенты получали бы довольно сырые предложения, которые лишены индивидуального подхода. 

С чего нужно начать начинающему специалисту?

Можно сказать, что дата-сайентист частично выполняет функции дата-аналитика и дата-инженера. Его основная цель — найти среди массы данных закономерности, которые в будущем приведут к лучшему результату. Несмотря на то, что это очень актуальная профессия, на рынке Казахстана существует нехватка специалистов. Сегодня вузы пока не готовят дата-сайентистов, поэтому часто ими становятся IT-специалисты с хорошим знанием высшей математики. 

Наверное, гуманитариям в этой среде придется не так просто, но все зависит от усилий и заинтересованности. В целом можно отметить, что начинающий дата-сайентист должен учиться следующему:

  • работать с большим объемом данных;
  • уметь визуализировать данные и просто объяснять их;
  • знать принципы машинного обучения;
  • владеть языком программирования, чаще — Python;
  • обладать коммуникативными навыками.

Еще много интересного

Статьи STEPPE

Работайте эффективнее с Алисой: 5 лайфхаков для удаленщиков

Работайте эффективнее с Алисой: 5 лайфхаков для удаленщиков

Тренд на удаленную работу продолжается. Все больше людей переходят на удаленную работу, но при этом поначалу сталкиваются с...

2 минуты
2 минуты
Canon представил новые беззеркальные камеры EOS R1 и EOS R5 Mark II
Партнерский

Canon представил новые беззеркальные камеры EOS R1 и EOS R5 Mark II

Canon Europe представила флагманские камеры EOS R1 и EOS R5 Mark II для системы EOS R, предназначенные для профессиональной...

1 минута
1 минута
Музыка индустриясындағы құқықтық дауларды заңгер Сәния Сұлтановамен бірге талқылаймыз

Музыка индустриясындағы құқықтық дауларды заңгер Сәния Сұлтановамен бірге талқылаймыз

Сәния Сұлтанова – авторлық құқық мәселелеріне маманданған, зияткерлік меншік саласының заңгері. Сәния Batyr Lab музыкалық...

11 минут
11 минут
Oraclus: Поисковая система казахстанской разработки отвечает на вопросы по Web3 при помощи алгоритмов GPT

Oraclus: Поисковая система казахстанской разработки отвечает на вопросы по Web3 при помощи алгоритмов GPT

О запуске стартапа в сфере блокчейн и развитии IT-бизнеса на международном рынке.

5 минут
5 минут