Выбор программного обеспечения для интеллектуальной системы голосового управления на транспорте
Введение
На сегодняшний день взаимодействие человека с компьютерными системами через управление речевыми командами рассматривается как один из самых удобных и перспективных форматов.
Распознавание голосовых команд является насущной проблемой при разработке многих передовых технологий. Основным направлением автоматизированных систем является создание систем голосового управления. Такие системы используются на контрольно-пропускных пунктах, в системе "умный дом", в голосовом управлении мобильным телефоном, в повседневной жизни людей с ограниченными возможностями и так далее.
Используется в приложениях. Поэтому даже у космонавтов это направление используется для контроля механизмов невесомости, когда космонавт находится в безопасном положении. [1]
К недостаткам существующих систем относятся высокая стоимость применения голосового управления и недостаточная деконструкция голосовых команд.
Содержание не найдено
Литература
1. Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов [Текст]/ А.В. Аграновский, Д.А. Леднов – М.: Радио и связь, 2004. – 164 с.
2. Жиляков Е.Г., Белов С.П., Прохоренко Е.И. Методы обработки речевых данных в информационно телекоммуникационных системах на основе частотных представлений [Текст]/ Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко. – Белгород: Изд-во БелГУ, 2007. - 136 с.
3. Жиляков Е.Г. Бабаринов С.Л. Чадюк П.В. Исследование сервиса компании Google Inc. по распознаванию русской речи / Е.Г. Жиляков, С.Л. Бабаринов, П.В. Чадюк // Научные ведомости Белгородского государственного университета. Серия: История. Политология. Экономика. Информатика № 15-1 (158)/ - том 27. – 2013.
4. Кипяткова И.С., Ронжин А.Л., Карпов А.А. Автоматическая обработка разговорной русской речи: монография / И.С. Кипяткова, А.Л. Ронжин, А.А. Карпов. СПИИРАН. − СПб.: ГУАП, 2013. − 314 с.
5. Мазуренко И.Л. Компьютерные системы распознавания речи / И.Л. Мазуренко// Интеллектуальные системы. Т. 3. Вып. 1–2. М., 1998.
6. Ронжин А.Л., Ли И.В. Автоматическое распознавание русской речи / А.Л. Ронжин, И.В. Ли //Вестник Российской академии наук, 2007, том 77, № 2, с. 133-138.
7. Шелухин О.И. Цифровая обработка и передача речи [Текст]. / О.И. Шелухин – М.: Радио и связь, 2000.– 454 с.
8. Assefi M. et al. An experimental evaluation of apple siri and google speech recognition / M. Assefi //Proceedings of the 2015 ISCA SEDE. – 2015.
9. Arriany A.A., Musbah M.S. Applying voice recognition technology for smart home networks / A.A. Arriany, M.S. Musbah //Engineering & MIS (ICEMIS), International Conference on. – IEEE, 2016. – С. 1-6.
10. Caranica A. et al. Speech recognition results for voice-controlled assistive applications / A. Caranica //Speech Technology and Human-Computer Dialogue (SpeD), 2017 International Conference on. – IEEE, 2017. – С. 1-8.
11. Dempsey P. The teardown: Google Home personal assistant / P. Dempsey //Engineering & Technology. – 2017. – Т. 12. – № 3. – С. 80-81.
12. Lovins, J.B. (1968). Development of a stemming algorithm. Mech. Translat. & Comp. Linguistics, 11, 22-31.
13. Natural Language Understanding Lecture 10: Introduction to Unsupervised Part-of-Speech Tagging // www.inf.ed.ac.uk URL: https://www.inf.ed.ac.uk/teaching/courses/nlu/lectures/nlu_l10_unsuptag1.pdf
В данной статье проанализирована только часть этих методов и сервисов, а именно те, которые более простые и новые в использовании.
В рамках представляемого исследования автором разработана система голосового управления и распознавания речи на базе инструментария Vosk с участием 30 разных дикторов, которые отдавали команды на двух разных языках.
Выполнено сравнение полученных результатов по трем критериям для определения оптимальной длины команды и среднего времени распознавания, обработки и получения обратной связи для исключения проблем в работе системы в дальнейшем.
Рассмотрим этапы разработки системы:
Выбор программного обеспечения.
Как было заявлено выше, данная система Vosk работает оффлайн и ей не нужен интернет для работы, интернет нужен только для обновления словаря, и нет лимита по количеству запросов [2,4,6];