Поиск объектов на изображении с помощью классических методов и методов компьютерного обучения

Скачать дипломную работу на тему: Поиск объектов на изображении с помощью классических методов и методов компьютерного обучения. В которой охарактеризовано исследование и сравнительный анализ классических методов поиска объектов на изображениях, методов компьютерного обучения и их комбинации в контексте обнаружения баннеров с текстом на карточках товаров.
Author image
Ekaterina
Тип
Дипломная работа
Дата загрузки
29.10.2024
Объем файла
2626 Кб
Количество страниц
40
Уникальность
Неизвестно
Стоимость работы:
2000 руб.
2500 руб.
Заказать написание работы может стоить дешевле

Введение
В современном мире задача обнаружения объектов на изображениях становится все более важной и актуальной в различных областях, включая медицину, промышленность, научные исследования, мониторинг окружающей среды и многие другие. Одной из ключевых задач в обработке изображений является поиск объектов, то есть обнаружение объектов на изображении и определение их местоположения. Точное и эффективное обнаружение объектов имеет широкий спектр приложений, таких как автоматическое распознавание лиц, диагностика заболеваний на медицинских изображениях, анализ снимков в научных исследованиях и многие другие.
В данной работе основной целью является исследование и сравнительный анализ классических методов поиска объектов на изображениях, методов компьютерного обучения и их комбинации в контексте обнаружения баннеров с текстом на карточках товаров. Эта задача имеет высокую практическую значимость, учитывая широкое распространение маркетплейсов и онлайн-торговли.
 

Введение 
1 Обзор классических методов и методов компьютерного обучения для поиска объектов на изображении 
1.1 Метод шаблона 
1.2 Метод Кэнни 
1.3 Сверточные нейронные сети
2 Практическая работа 
2.1 Применение метода шаблона для локализации баннеров
2.2 Совместное использование методов шаблона и Кэнни для локализации баннеров 
2.3 Сверточная нейронная сеть в задаче локализации баннеров
Заключение
Литература
Приложения
Приложение А
Приложение Б 
Приложение С

[1] Документация библиотеки компьютерного зрения «OpenCV», доступная на –  https://docs.opencv.org/3.4/de/da9/tutorial_template_matching.html
[2] Катанаев М. О., «Геометрические методы в математической физике», c. 106-108, 2016.
[3] Г. Г. Кутузова и А. Н. Рудакова.  «Цифровая обработка изображений в информационных системах», с. 36-41 2000.
[4] Zhongjie Cui et al 2020 J. Phys.: Conf. Ser. 1693 012163, «A Fast Image Template Matching Algorithm Based on Normalized Cross Correlation»
[5] I. Sobel, "A 3x3 Isotropic Gradient Operator for Image Processing"
[6] J.F. Canny, "Finding edges and lines in images," M.I.T. Artif. Intell. Lab., Cambridge, MA, TR-720, 1983.
[7] J.F. Canny, «A computational approach to edge detection», IEEE Transactions on Pattern Analysis and Machine Intelligence PAMI-8(6):679 – 698, December 1986.
[8] H. LIU, K. C. JEZEK, «Automated extraction of coastline from satellite imagery by integrating Canny edge detection and locally adaptive thresholding methods». INT. J. REMOTE SENSING, 10 MARCH, 2004, VOL. 25, NO. 5, 937–958(2004).
[9] Richard Szeliski, «Computer Vision: Algorithms and Applications 2nd Edition»,p – 97,98,(2021)
[10] Luo, Z., Li, X., Huang, J. et al. «Understanding the Disharmony between Dropout and Batch Normalization by Variance Shift». Neural Comput & Applic 31, 205–214 (2019).
[11] Ian Goodfellow, Yoshua Bengio, Aaron Courville, « Deep Learning », 2018
[12] Электронный учебник по компьютерному зрению доступный на –  http://amroamroamro.github.io/mexopencv/opencv/mask_tmpl_demo.html
 [13] Документация по фреймворку для глубоко обучения Keras доступная на – «https://www.tensorflow.org/api_docs/python/tf/keras/activations/linear»
[14] Karen Simonyan, Andrew Zisserman, «Very Deep Convolutional Networks for Large-Scale Image Recognition», arXiv:1409.1556

 

Основной идеей метода шаблонов является нахождение сходства между шаблоном и частью изображения. Шаблон представляет собой небольшое изображение, которое содержит информацию о форме и текстуре объекта, который необходимо найти. Для поиска объекта в изображении шаблон сканируется по всему изображению, и на каждом шаге вычисляется мера сходства между шаблоном и частью изображения. Мера сходства может быть вычислена различными способами, но наиболее распространенным является корреляция. Корреляция – это мера сходства между двумя векторами, которая вычисляется как сумма произведений соответствующих элементов этих векторов. В случае метода шаблонов корреляция вычисляется между пикселями шаблона и пикселями изображения, где пиксели служат элементами векторов. Однако, простое вычисление корреляции может привести к ошибочным результатам, так как изменение освещения, шум и другие факторы могут существенно повлиять на меру сходства. Поэтому, для устранения этих проблем, используются различные методы предобработки изображения, такие как фильтрация, уменьшение размерности и нормализация.