Canon EOS R1 и EOS R5 Mark II: тест драйв новинок на гоночной трассе в Австрии
В начале сентября на легендарной трассе Red Bull Ring в Австрии прошла презентация новейших продуктов компании Canon — камер...
Киборгини — совместный проект Степи с Halyk Bank. В рамках него мы рассказываем о шести девушках, которые вместе с большим банковским блоком стоят за развитием IT-индустрии Казахстана, кодят и программируют по будням, а в свободное время ломают стереотипы общества об образе жизни айтишниц.
Наша шестая героиня — главный Data Scientist Жазира Шайхиева. Она работает с большим объемом информации в рамках проекта банка «Фабрика данных», а свободное время посвящает саморазвитию: занимается спортом, кройкой и шитьем и осваивает IT-навыки.
«Я стараюсь проводить все свободное время максимально продуктивно, чтобы не упустить ничего. Бывает, что из-за такого загруженного графика сильно устаю, но путешествия всегда помогают восстанавливать силы», — рассказывает девушка.
Data Science — это работа с большим объемом данных. Обычно IT-специалисты получают их в виде неструктурированной информации, которую необходимо обработать, провести анализ и построить математическую модель. В результате модель помогает составить определенный прогноз для бизнеса и решить необходимую задачу.
Например, какие предложения являются наиболее востребованными, на какие объявления чаще откликаются или даже то, как правильно выстроить ленту рекомендаций в YouTube или TikTok. Та же таргетированная реклама основана на моделях, которые разрабатывают дата-сайентисты. Учитывая то, что любой бизнес нуждается в прогнозах и оценках для действующих и будущих проектов, Data Science становится актуальнее с каждым днем.
В дата-сайентистах нуждается любая корпорация или крупная компания, которая сталкивается с большим объемом данных или внушительной клиентской базой. К основным направлениям можно отнести следующие сферы:
Несмотря на это, полноценный список сфер представить невозможно, потому что с развитием технологий и искусственного интеллекта даже маленькие компании стали прибегать к услугам дата-сайентистов. В основе работы Data Science находится анализ данных, который помогает найти определенные закономерности и выстроить рекомендации. Эти рекомендации могут помочь бизнесу в том, чтобы улучшить свои сервисы, понять, что именно интересует их клиентов и какие техники лучше применить для оптимизации процессов.
У меня с детства была склонность к математике и информатике. В школе всегда участвовала в различных конкурсах и олимпиадах, где получала призовые места. В старших классах уже точно знала, что буду заниматься программированием, поэтому решила поступить на факультет мехмата. Все эти знания пригодились мне в сфере Data Science, потому что работа построена на работе с цифрами и информацией.
Если говорить о базовых навыках, то дата-сайентисту нужно знать математику, математическую статистику, принципы машинного обучения и основной язык программирования.
К дополнительным навыкам можно отнести умение визуализировать данные и способность работать в команде. Визуализация нужна для того, чтобы работать с огромным объемом данных и на основе них наглядно составлять прогнозы и объяснять их. Умение работать в команде и коммуникативные тоже очень важны, потому что деятельность дата-сайентиста может быть тесно связана с другими IT-специалистами. Необходимо быть динамичным и постоянно совершенствоваться: Data Science развивается с каждым днем, поэтому всегда нужно дорабатывать или оптимизировать процессы.
К базовым языкам дата-сайентиста можно отнести Python и SQL. Сначала мы собираем информацию в базу данных. Далее с помощью Python создаем модель, которая считывает информацию и выводит результат. На основе него мы и строим прогноз.
В банках существует большая клиентская база. Она требует анализа для того, чтобы улучшить работу сервиса и разработать новые предложения для клиентов. Кроме того, Data Science в банке анализирует различные финансовые операции клиента, которые помогают определить, стоит ли выдавать кредит тому или иному человеку.
В Halyk Bank существует отдельный департамент дата-сайентистов. Он разделяется на две категории: по работе юридическими и физическими лицами. Розничный, в котором состоит наша команда, работает над улучшением клиентских сервисов. С помощью машинного обучения мы разделяем клиентов на определенные категории, определяя, кто из них наиболее активен, а кто находится под риском ухода. С учетом этих прогнозов составляем индивидуальные предложения, которые затем приходят в виде уведомлений, пушей и сообщения.
Сейчас мы реализуем большой проект «Фабрика данных», который ориентирован на развитие Data Science в банке. Мы проводим много времени за анализом данных о клиентах, чтобы найти закономерности и улучшить продукты банка.
«Фабрика данных» — это огромный проект, в котором участвуют дата-сайентисты, разработчики, дата-инженеры и представители бизнеса. Это командная работа не только внутри департамента, но и с другими IT-специалистами. Сначала мы получаем большие объемы информации, затем создаем алгоритмы и модели, а после тестируем и проверяем гипотезы. Если в банке не было бы дата-сайентистов, то клиенты получали бы довольно сырые предложения, которые лишены индивидуального подхода.
Можно сказать, что дата-сайентист частично выполняет функции дата-аналитика и дата-инженера. Его основная цель — найти среди массы данных закономерности, которые в будущем приведут к лучшему результату. Несмотря на то, что это очень актуальная профессия, на рынке Казахстана существует нехватка специалистов. Сегодня вузы пока не готовят дата-сайентистов, поэтому часто ими становятся IT-специалисты с хорошим знанием высшей математики.
Наверное, гуманитариям в этой среде придется не так просто, но все зависит от усилий и заинтересованности. В целом можно отметить, что начинающий дата-сайентист должен учиться следующему:
Получай актуальные подборки новостей, узнавай о самом интересном в Steppe (без спама, обещаем 😉)
(без спама, обещаем 😉)