Исследование алгоритмов обработки изображения для систем захвата движения
Введение
Актуальность. Согласно данным Всемирной̆ федерации глухих [1] во всем мире живут примерно 72 млн. глухих людей̆, которые в повседневной̆ жизни общаются между собой̆ на языке жестов. В отличие от людей̆, которые стали глухими в результате несчастного случая или по причинам заболеваний, люди, не слышащие с рождения, предпочитают жестовый̆ язык обыкновенному тексту. Им легче принять и показать жесты, чем читать или набрать текст на клавиатуре компьютера или телефона. Трудность общения также возникает при общении глухого человека со слышащим, когда слышащий̆ человек не владеет жестовым языком.
Для решения данных проблем проводятся исследования по созданию систем автоматического сурдоперевода и систем, оснащенных более естественным человеко-машинным интерфейсом для глухих людей̆. Например, в работе [2] предлагается система перевода жестового языка в текст. Получая на входе жесты, система переводит их в текстовый̆ вид. Ввод информации о жестах осуществляется с помощью беспроводной̆ перчатки, оснащённой̆ сенсорами. Несмотря на попытки создания недорогих перчаток доступных конечным пользователям, до сих пор их цена остается высокой̆. Другим сдерживающим фактором является потребность в одевании перчаток во время жестикуляции. В работе [3] распознавание жестов осуществляется с помощью цветной̆ камеры посредством обнаружения кончиков пальцев руки. Достигнута точность распознавания на уровне 95%, однако предложенный̆ алгоритм ограничивается анализом простых статических жестов языка ASL (American Sign Language). В работе [4] рассматривается обратное действие – перевод текста в жестовый̆ язык. Получая на входе текст со словами, ударениями и другими атрибутами, программа выполняет анимацию жестов и мимики лица с помощью трёхмерной̆ модели человека.
Содержание
Введение 4
1 Анализ предметной области 8
1.1 Постановка задачи 8
1.2 Обзор аналогов 10
1.3 Компьютерное зрение 14
1.4 Особенности, требования и ограничения разрабатываемой системы 18
1.5 Выводы 19
2 Выбор методов и алгоритмов решения поставленной задачи 20
2.1 Основные этапы работы системы 20
2.2 Захват видео и извлечение изображений 21
2.3 Предварительный поиск ключевых кадров 22
2.4 Выбор метода распознавания 23
2.5 Предварительная обработка изображений 26
2.6 Контурный анализ 33
2.6.1 Оператор Собеля 33
2.6.2 Оператор Лапласа 35
2.6.3 Оператор Прюитт 37
2.6.4 Оператор Кэнни 37
2.7 Анализ контуров и классификация 46
2.8 Распознавание слова 49
2.9 Обучение 49
2.10 Выводы 50
3 Разработка и тестирование прототипа системы 52
3.1 Выбор средств разработки 52
3.2 Структура системы 53
3.3 Результаты разработки и тестирования 57
3.4 Выводы 61
Заключение 63
Не найдено
Этот подход достигает одни из лучших результатов бинаризации среди методов локального значения, описанных выше. Однако, производительность метода Кристина значительно ухудшается, если имеются заметные изменения серого фоновых значений по всему изображению. Методы бинаризации на основе гистограмм. Данные методы основываются на нахождении значений яркости с помощью построения гистограммы содержащей функцию яркости от количества точек с соответствующей яркостью. Одним из таких методов является Метод «Мод», который обычно используется для изображений с хорошо отделимым фоном и объектом, так как на гистограмме будет видно два хорошо различимых пика. Порог в данном случае можно найти на впадине между двумя этими пиками, соответствующие значение интенсивности этого минимума будет являться порогом для бинаризации. Данный метод плохо работает на изображениях с низкой яркостью, так как при этом возникают значительные погрешности.