Учебное пособие. — Новосибирск: РИЦ НГУ, 2016. — 166 с. — ISBN: 978-5-4437-0548-4.
В пособии рассмотрены формальные модели текстов на естественном языке, основанные на методах математической логики, линейной алгебры, теории вероятностей и математической статистики, а также изложены алгоритмы обработки текстов, применяемые для семантического анализа, классификации, поиска и извлечения информации.
Пособие предназначено для студентов и аспирантов ФИТ, ММФ и ГФ (отделение фундаментальной и прикладной лингвистики).
Предисловие.
Введение.
Устройство систем автоматической обработки текстов.
Модели задания синтаксической структуры предложений.
Принципы построения синтаксических анализаторов.
Формальные грамматики.
Методы теоретического исследования семантики текстов.
Представление знаний для компьютерной обработки.
Методы классификации и кластеризации.
Прикладные задачи автоматической обработки текстов.