Интернет-издание, 2025. — 128 с.
При решении задач машинного обучения и анализа данных важным этапом является «разведочный анализ данных» (EDA – Exploratory Data Analysis): исследователи делают визуализацию набора данных (датасета) и на основе её анализа
понимают смысл частей данных,
делают гипотезы о зависимостях в данных,
обнаруживают нелогичности и артефакты (пропуски, выбросы и т.п.),
находят подтверждения или опровержения своих гипотез.
За 20 с небольшим лет преподавания автор убедился, что научить правильному построению визуализации, её критическому анализу и использованию выводов такого анализа очень сложно. Здесь гораздо большее значение имеют врождённые качества и психологический настрой, которые приводят к
сомнениям в том, что в данных всё логично,
игре со способами визуализации, масштабами осей и т.п.,
критическому взгляду на стандартные методы обработки данных.
Но можно раскрыть и закрепить талант визуального анализа. Для этого была придумана серия упражнений, одно из которых – авторская игра «Что здесь изображено?» (иногда она называлась «Что за данные?»).
В этой игре показывается какая-то визуализация, иногда ключевые элементы в ней скрыты, задача участников – догадаться, что изображено на картинке.