Что такое визуализация данных и как ее применять?

12 минут Молдир Мухит
Альтернативный текст

Информация усваивается лучше, если ее подать в виде схем, графиков и диаграмм. Сейчас визуализация данных является одним из важнейших инструментов и упрощает наше понимание объемных данных в век информационных технологий.

Что такое визуализация данных?

Визуализация данных — это то, что превращает большие и маленькие данные в вижуал, который человеческому мозгу легче понять и обработать.

Идея использования изображений для понимания данных существовала давно — от карт и графиков в 17 веке до изобретения круговой диаграммы в начале 1800-х годов.

Один из самых ярких примеров статистической графики —карта вторжения Наполеона в Россию Чарльза Минарда. На ней были показаны размеры армии, а также путь отступления Наполеона из Москвы: эта информация была привязана к температурным и временным шкалам для более глубокого понимания события.

Современные компьютеры обрабатывают большие объемы данных с молниеносной скоростью. Сегодня визуализация данных превратилась в быстро развивающееся сочетание науки и искусства, которое будет в тренде в обозримом будущем.

Зачем визуализировать?

Согласно недавнему исследованию Microsoft, средняя продолжительность концентрации внимания человека 8 секунд, что, кстати, на секунду меньше, чем средняя продолжительность концентрации внимания у рыбы.

Люди реагируют на визуальные эффекты лучше, чем на любой другой тип стимуляции. Человеческий мозг обрабатывает визуальную информацию в 60 тыс. раз быстрее, чем текст. Зрительные данные составляют 90% информации, передаваемой в мозг.

Визуализация данных используется во всех отраслях: она является важным шагом в аналитике данных, дает компаниям возможность критически оценить информацию и запросы аудитории. 

Какой бывает визуализация?

Раньше самым простым и распространенным способом создания визуализации данных была информация из электронной таблицы Excel и преобразование ее в гистограмму, круговую диаграмму или таблицу.

Этот метод по-прежнему чрезвычайно эффективен, но искусство визуализации данных также прошло долгий путь за последние 20 с лишним лет. Существует множество инструментов, помогающих c визуализацией данных. Диаграммы и графики упрощают понимание результатов, даже если вы можете определить закономерности без них.

Графики

График показывает изменения во времени. Ось X обычно представляет собой период времени, а ось Y — количество. 

Гистограмма

Гистограмма также показывает изменения во времени. Но если существует более одной переменной, гистограмма может упростить сравнение данных для каждой переменной. 

Пузырьковая диаграмма

Пузырьковая диаграмма изображается в виде пузырька и является адаптацией точечной диаграммы. 

Круговая диаграмма

Круговая диаграмма показывает каждый элемент как часть целого и является лучшим вариантом для иллюстрации процентов.

Карта

Карта помогает понимать локальность предмета исследования. Ведь большинство данных содержат элемент местоположения. 

Инфографика

Инфографика требует обширного набора информации и дает исчерпывающее визуальное представление. Она отлично подходит для изучения сложных и очень субъективных тем.

источник: publishersweekly.com

Примеры визуализации данных 

Альберто Каиро — один из лучших дата-журналистов — сказал, что визуализация данных является наиболее эффективным способом в предоставлении информации во время пандемии.

Вспомним карту, составленную Университетом Джона Хопкинса про распространение COVID-19.  

Пример хорошей инфографики — анализ развития Казахстана с 1991 по 2021 год.  Визуализация дает отчетливо понять, в какой сфере наблюдается спад, а в какой — прогресс. 

источник: forbes.kz

Эта карта мира создана с помощью инструмента Blueshift для визуализации торговли глобальными товарами, такими как продукты питания и одежда. Точки «исходят» из одной страны и переходят в другие, показывая, на каких товарах эта страна специализируется, а что другие страны покупает у нее. При нажатии на отдельные страны отображается их экспорт и импорт.

Гистограммы бывают разные. Один из наглядных примеров —миграция. Мы можем увидеть, что большинство трудовых мигрантов в России родом из Узбекистана. Из Таджикистана приезжает почти в два раза меньше мигрантов, следом за ним — мигранты из Кыргызстана. Меньше всего мигрантов — из Казахстана.

источник: forbes.kz

Бесплатные инструменты визуализации данных 

Инструменты визуализации данных могут помочь вам превратить данные во что-то мощное и красивое.

Tableau — пользователь легко может загрузить данные, составление карт — одна из самых сильных сторон этого приложения.

Infogram — очень удобный и легкий интерфейс. Он позволяет создать инфографику за считанные минуты. В наличии 31 вид эффектных диаграмм, включая радиальные, точечные, пузырьковые диаграммы и карты.

Plotly — создает графики, диаграммы, презентаций, датасеты и уникальные дашборды. Есть платная и бесплатная версии.

Datawrapper — удобный и быстрый способ визуализировать данные в виде графиков и таблиц. 

Google Data Studio  позволяет подключать данные в реальном времени. Бесплатная платформа для визуализации данных.

Существует также еще один инструмент, позволяющий создать визуализацию данных, включая разные виды диаграмм, гисторгамм и таблиц. Этим инструментом пользуются 90% компаний.

Что такое PowerBI и зачем он нам нужен?

PowerBI (Power Business Intelligence) — это программа, с помощью которой можно собрать в одном месте данные из разных источников —Excel, csv, SQL, Google Analytics, а также создать модель данных, проанализировать их и применить интерактивный дашборд из сотен вариантов визуализаций. PowerBI пришел на смену Excel. 

Одной из тех, кто основал сообщество BI-аналитиков и регулярно проводит курсы PowerBI является — Екатерина Рехерт. Она основала компанию Databoom. kz и она с командой помогает новичкам освоить сферу анализа данных. 

 

работа ученицы Екатерины Рехерт, Елены Афонины

Зачем нужен PowerBI?

Екатерина рассказывает, что PowerBI делает то же самое, что  Excel, но гораздо быстрее в несколько кликов. Любой человек может за короткое время с нуля освоить этот инструмент и приобрести востребованный на рынке навык Business Intelligence-аналитики.

PowerBI состоит из трех компонентов:

1. Редактор PowerQuery — «кухня» PowerBI
2. Модель данных и формулы DAX — data analytics expressions — «сердце» PowerBI 
3.  Визуализации PowerBI

PowerBI — это не только про то, как строить графики. Ведь 80% времени работы уходит на очистку данных в PowerQuery и моделирование с помощью DAX. 

Как можно изучить PowerBI и сколько потом можно на этом заработать?

Можно освоить этот инструмент самостоятельно с помощью бесплатных онлайн курсов и документации или присоединиться к казахстанскому сообществу BI-аналитиков и пройти бесплатные воркшопы, которые проводятся регулярно, а также получить доступ к чату сообщества, где можно задать любой вопрос.

По словам Екатерины, топовые компании во всех сферах — Beeline, Mars, «КазМунайГаз», Toyota, AirAstana, «Евразийский банк», Kimberly Clark, Kolesa Group, Национальный банк Казахстана, «Самрук-Казына» уже внедрили Power BI. 

По данным Kolesa Group, средняя зарплата казахстанских специалистов BI-аналитиков 480 тыс. тг.

Статьи STEPPE

Подборка бесплатных онлайн-курсов, международных конкурсов, стипендий и стажировок

Курс по 3D-моделированию, программа обмена для девочек в программировании, грант на арт-проект художникам и стипендии для бакалавров.

9 минут
9 минут
Партнерский

Дал Бог зайку, даст и безопасный интернет: как уберечь ребенка в сети?

Сегодня вместе с экспертом из «Лаборатории Касперского» разбираемся в непростом вопросе безопасности детей во всемирной паутине. Гость выпуска — Ольга Ким, дизайнер и мама двоих детей. Выясняем, чем опасен интернет для малышей и подростков и где проходит грань между слежкой и родительским контролем.

11 минут
11 минут

Спецпроект: 13 писем к Новому году

Музыкант, врач, учительница, бариста и стендапер написали теплые письма с поздравлениями. Спешите их получить!

0 секунд
0 секунд

Диагноз, о котором молчат: как жить с дислексией в Казахстане?

Что такое дислексия, как подстроить жизнь под эту особенность и почему в стране нет официальной статистики по дислектикам.

21 минута
21 минута