Пер. с англ. — Черноголовка: ИПХФ РАН, 2005. — 160 с.
Это пособие расскажет об использовании современных подходов к моделированию многомерных и многофакторных процессов и явлений, который основаны на использовании проекционных математических методов. Такого рода информация позволяет определять в больших массивах данных скрытые переменные и анализировать связи, существующие в изучаемой системе. Также в книге изложены базовые сведения из теории билинейного проекционного моделирования многомерных данных. Включены основные рамки, в которых должно проводиться такое моделирование. В книгу также вошли многочисленные примеры, которые позволят усвоить этот подход. Данное издание ориентировано на широкий круг специалистов, которые интересуются современными методами анализа данных.
Предисловие редактора перевода
Предисловие к русскому изданию
Предисловие к пятому изданию
Об авторе книги
Введение в анализ многомерных данныхКосвенные наблюдения и корреляция
Скрытые структуры данных
Сравнение анализа многомерных данных и многомерной статистики
Основные задачи анализа многомерных данных
Проекционный подход к многомерному анализу
Метод главных компонент (МГК). ВведениеПредставление данных в виде матриц
Пространство переменных. Изображение образцов в р-мерном пространстве
Изображение образцов в пространстве переменных
Первая главная компонента
Главные компоненты высших порядков
Модель главных компонент : счета и нагрузки
Задачи МГК
График счетов - «карта образцов»
График нагрузок - «карта переменных»
Упражнение: построение и интерпретация МГК-модели (People/ Люди)
МГК-модели
Практическое применение метода главных компонент (МГК)Шкалирование или взвешивание
Выбросы
МГК: шаг за шагом
МГК: краткий обзор
МГК - что может быть не так?
Упражнение - определение выбросов (TROODOS)
Многомерная калибровка (РГК/ПЛС)Многомерное моделирование (Х, У) : стадия калибровки
Многомерное моделирование (Х,У) : стадия предсказания
Требования к данным для калибровки (обучающие данные)
Введение в процедуру проверки модели
Количество компонент (размерность модели)
Одномерная регрессия (ylx) и МЛР
Коллинеарность
РГК - регрессия на главные компоненты
ПЛС - регрессия на латентные структуры
Когда какой метод использовать?
Выводы
Проверка: обязательное подтверждение работоспособностиИдея проверки с помощью тестового набора
Требования к тестовому набору
Перекрестная проверка
Проверка корректировкой размахом
Как построить РГК и ПЛСПЛС и РГК: шаг за шагом
Оптимальное число компонент при моделировании
Информация, заложенная в старших компонентах
Упражнения по применению ПЛС и РГК- суть дела!
ПЛС (РГК) многомерная калибровка на практикеВыбросы и подгруппы
Систематическая ошибка
Преобразования
Нелинейности
Процедуры для улучшения модели
Точные измерения против зашумленных измерений
Как интерпретировать график остаточной дисперсии
Итоги: Сложности, которые могут выявить графики в программе
UnscгamЫer
Проекционные методы на практике. УпражненияПрименение метода главных компонент
Применение методов ПЛС (РГК)
Приложение: алгоритмыП. МГК
П.2 . РГК
П . 3 . ПЛС
П. ПЛС2
Словарь терминов, относящих к многомерному анализу данных
Литература