Зарегистрироваться
Восстановить пароль
FAQ по входу

Меджедович Д., Тахирович Э. Алгоритмы и структуры для массивных наборов данных

  • Файл формата pdf
  • размером 63,34 МБ
Меджедович Д., Тахирович Э. Алгоритмы и структуры для массивных наборов данных
ДМК Пресс, 2024. — 342 c. — ISBN 978-5-93700-250-1.
Стандартные алгоритмы и структуры при применении к крупным распределенным наборам данных могут становиться медленными — или вообще не работать. Правильный подбор алгоритмов, предназначенных для работы с большими данными, экономит время, повышает точность и снижает стоимость обработки. Книга знакомит с методами обработки и анализа больших распределенных данных. Насыщенное отраслевыми историями и занимательными иллюстрациями, это удобное руководство позволяет легко понять даже сложные концепции. Вы научитесь применять на реальных примерах такие мощные алгоритмы, как фильтры Блума, набросок count-min, HyperLogLog и LSM-деревья, в своих собственных проектах.
Предисловие
Введение
Часть I. Наброски на основе хеша
Обзор хеш-таблиц и современного хеширования
Приближенная принадлежность: блумовские и порционные фильтры
Оценивание частоты и набросок count-min
Оценивание кардинального числа и алгоритм HyperLogLog
Часть II. Реально-временная аналитика
Потоковые данные: сведение всего воедино
Формирование выборок из потоков данных
Приближенные квантили на потоках данных
Часть III. Структуры данных для баз данных и алгоритмы внешней памяти
Введение в модель внешней памятих
Структуры данных для баз данных: B-деревья,
Bε -деревья и LSM-деревья
Сортировка во внешней памяти
Справочные материалы
Приведены примеры на Python, R и в псевдокоде
  • Возможность скачивания данного файла заблокирована по требованию правообладателя.
  • С условиями приобретения этих материалов можно ознакомиться здесь.