Известия Саратовского университета. Новая серия.

Серия Математика. Механика. Информатика

ISSN 1816-9791 (Print)
ISSN 2541-9005 (Online)


Для цитирования:

Савин А. Н., Тимофеева Н. Е., Гераськин А. С., Мавлютова Ю. А. Разработка системы распознавания речи на основе скрытых марковских моделей отдельных слов // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2017. Т. 17, вып. 4. С. 452-464. DOI: 10.18500/1816-9791-2017-17-4-452-464, EDN: ZXJPON

Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0).
Опубликована онлайн: 
28.11.2017
Полный текст:
(downloads: 296)
Язык публикации: 
русский
Рубрика: 
УДК: 
004.934
EDN: 
ZXJPON

Разработка системы распознавания речи на основе скрытых марковских моделей отдельных слов

Автор:
Импортов Импорт Импортович
Авторы: 
Савин Александр Николаевич, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Тимофеева Надежда Евгеньевна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Гераськин Алексей Сергеевич, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Мавлютова Юлия Альбертовна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Аннотация: 

Приведены результаты разработки программных модулей, реализующих систему распознавания речи на основе скрытых Марковских моделей отдельных слов и использования линейного предсказания при кодировании признаков звукового сигнала. Обосновывается структура системы распознавания речи, использующая скрытые марковские модели отдельных слов, состоящая из четырех модулей: модуль выделения слов из звукового потока, модуль анализа признаков слова, модуль обучения скрытых марковских моделей и модуль распознавания слов. Приводятся алгоритмы формирования скрытых марковских моделей с лево-правой топологией для отдельных слов требуемого словаря команд системы управления объекта, основанные на кодировании признаков звукового сигнала, использующего линейные предсказания. Приведены результаты оценки достоверности последовательности наблюдений, соответствующих отдельным словам, получаемым с помощью предложенного алгоритма обработки. Разработанные программные модули позволяют эффективно подготавливать необходимые исходные данные и формировать таким образом требуемый словарь команд системы управления объекта, строить скрытые марковские модели отдельных слов, проводить их обучение  с помощью алгоритма Баума - Велша. Построенные словари команд предполагается использовать в интеллектуальных системах управления различными объектами.

Список источников: 
  1. Жиляков Е. Г., Бабаринов С. Л., Чадюк П. В. Исследование сервиса компании Google Inc. по распознаванию русской речи // Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. 2013. № 15(158), вып. 27/1. С. 247–255.
  2. Титов Ю. Н. Современные технологии распознавания речи // Вестн. Тамб. ун-та. Сер. Естественные и технические науки. 2006. Т. 11, вып. 4. С. 571–574.
  3. Савин А. Н., Тимофеева Н. Е., Гераськин А. С., Мавлютова Ю. А. Разработка компонентов программного комплекса для потоковой фильтрации аудиоконтента на основе использования скрытых марковских моделей // Изв. Сарат. ун-та. Нов. сер. Сер. Математика. Механика. Информатика. 2015. Т. 15, вып. 3. С. 340–350. DOI: https://doi.org/10.18500/18169791-2015-15-3-340-350.
  4. Рабинер Л. Р. Скрытые Марковские модели и их применение в избранных приложениях при распознавании речи : Обзор // ТИИЭР. 1989. Т. 77, № 2. С. 86–120.
  5. Портал компании National Instruments Russia. URL: http://www.labview.ru (дата обращения: 15.12.2017).
  6. Блейхут Р. Быстрые алгоритмы цифровой обработки сигналов. М. : Мир, 1989. 448 с.
  7. Адлер Ю. П., Маркова Е. В., Грановский Ю. В. Планирование эксперимента при поиске оптимальных условий. М. : Наука, 1976. 279 с.
Поступила в редакцию: 
08.07.2017
Принята к публикации: 
09.11.2017
Опубликована: 
05.12.2017
Краткое содержание:
(downloads: 119)