Известия Саратовского университета. Новая серия.

Серия Математика. Механика. Информатика

ISSN 1816-9791 (Print)
ISSN 2541-9005 (Online)


Для цитирования:

Савин А. Н., Тимофеева Н. Е., Гераськин А. С., Мавлютова Ю. А. Разработка компонентов программного комплекса для потоковой фильтрации аудиоконтента на основе использования скрытых марковских моделей // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2015. Т. 15, вып. 3. С. 340-350. DOI: 10.18500/1816-9791-2015-15-3-340-350, EDN: UKIVHN

Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0).
Опубликована онлайн: 
11.09.2015
Полный текст:
(downloads: 269)
Язык публикации: 
русский
Рубрика: 
УДК: 
004.934
EDN: 
UKIVHN

Разработка компонентов программного комплекса для потоковой фильтрации аудиоконтента на основе использования скрытых марковских моделей

Авторы: 
Савин Александр Николаевич, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Тимофеева Надежда Евгеньевна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Гераськин Алексей Сергеевич, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Мавлютова Юлия Альбертовна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Аннотация: 

Приведены результаты разработки эффективных алгоритмов потокового распознавания речи с помощью стохастических моделей, основанных на использовании скрытых марковских моделях. В статье приводятся основные теоретические сведения для скрытой марковской модели дискретной системы, выделяются параметры, необходимые для ее определения, также рассмотрены три основные задачи, которые должны быть решены для успешного применения скрытой марковской модели в системах распознавания речи. Приводятся алгоритмы метода Баума–Велша, направленного на уточнение параметров модели и метода Витерби, подбора наиболее вероятной последовательности состояний системы. Эти два метода реализованы в среде графического программирования LabVIEW в виде программных модулей, реализующих построение скрытых марковских моделей отдельных слов с использованием метода Баума–Велша и распознавание этих слов на основе метода Витерби. Предполагается использование данных модулей для реализации потоковой фильтрации аудиоконтента в цифровых системах связи.

Список источников: 
  1. Гоноровский И. С., Демин М. П. Радиотехнические цепи и сигналы. М. : Дрофа, 2006. 719 с.
  2.  Сергиенко А. Б. Цифровая обработка сигналов. СПб. : Питер, 2007. 750 с.
  3.  Рабинер Л. Р. Скрытые Марковские модели и их применение в избранных приложениях при распознавании речи // ТИИЭР. 1989. Т. 77. С. 86–120.
  4.  Narada Warakagoda A Hybrid ANN-HMM ASR system with NN based adaptive preprocessing M. Sc. thesis. URL: http://jedlik.phy.bme.hu/ gerjanos/HMM/hoved.html (Accessed: 21.12.2012).
  5. Портал компании National Instruments Russia. URL: http://www.labview.ru (дата обращения: 25.12.2012).
Поступила в редакцию: 
26.04.2015
Принята к публикации: 
28.08.2015
Опубликована: 
30.09.2015