СПб.: Университет ИТМО, 2014. — 92 с.
В учебном пособии рассматриваются технологии синтеза интонационной речи. Синтез речи является одной из важнейших задач речевой обработки и имеет широкое применение в современных информационных технологиях. Материал пособия разбит на 6 разделов. Изложены история вопроса и основные этапы разработки систем автоматического синтеза. Пособие может быть использовано при подготовке магистров по направлению 230400.68 “Информационные технологии”, а также магистров по направлению 230100.68 “Информатика и вычислительная техника” и аспирантов.
Введение.
Системы синтеза речи: история развития, современное состояния.Первые механические синтезаторы.
Первые электрические синтезаторы.
XX век: синтезаторы первого поколения.
Артикуляционный синтез.
Формантный синтез.
Синтезаторы, использующие линейное предсказание.XX век: синтезаторы второго поколения.
XX век: синтезаторы третьего поколения.
Селективный синтез речи.
Статистический параметрический синтез.Перспективные направления синтеза.
Обзор технологий TTS.Типы синтезаторов.
Параметрический синтез.
Компилятивный синтез.
Синтез речи по фонетическим правилам.Оценка качества синтеза речи.
Структура TTS.
Лингвистический текстовый процессор.Задачи лингвистического процессора.
Нормализация текста (графематический анализ).
Выделение предложений, слов, символов, знаков препинания.
Обработка пользовательской разметки.
Расшифровка нестандартных записей.Использование словарей в синтезе речи.
Обработка незнакомых слов.
Снятие омонимии (омографии).
Методы разрешения неоднозначности при анализе текста.
Синтаксический и морфологический анализ предложения.
Статистические методы.Просодический процессор.Определение границ синтагм.
Установка пауз по правилам.
Установка пауз на основе статистических моделей.Определение интонационного контура.
Генерация контура F0 методом ресинтеза.
Формирование контура F0 для произвольного предложения.
Генерация тонального контура в системах инженерного типа.
Генерация тонального контура на основе лингвистических моделей интонации.Примеры интонационных контуров.
Фонетический процессор.Построение транскрипции.
Вычисление физических параметров.
Акустический процессор.Оптимальный выбор звуковых элементов методом Unit Selection.
Стоимость замены.
Стоимость связи.
Поиск по алгоритму Витерби.
Речевая база и качество синтеза для метода Unit Selection.
Основные сложности и ограничения применения метода Unit Selection.Сглаживание энергетической огибающей.
Модификация звуковых элементов.
Алгоритм TD-PSOLA.
Алгоритм SPECINT (Spectrum Interpolation).
Алгоритм LP-PSOLA.
Экспериментальные сравнения.Объединение элементов в единый звуковой поток.
Звуковые эффекты, используемые при синтезе речи.
Параметрический эквалайзер.
Ревербератор.Синтез, основанный на моделях.Литература.