Разработка веб-приложения для подготовки обучающих выборок с помощью ручой разметки изображений
ВВЕДЕНИЕ
За последние 20 лет развития информационных технологий нейросети стали незаменимым инструментом для решения сложных задач, с которыми сталкивается общество. Обучение с учителем, как один из распространенных подходов в машинном обучении, играет важную роль в достижении успеха во множестве практических и исследовательских задач. Однако, ключевым фактором эффективности этого подхода остается доступность качественных размеченных данных. Ограниченный объем или низкое качество данных могут представлять серьезные вызовы для применения алгоритмов машинного обучения. В свете этих факторов важно придавать особое внимание разметке данных, так как от качества меток зависит точность и эффективность алгоритмов обучения с учителем. Решение проблемы отсутствия размеченных данных, их малого объема или низкого качества становится одним из главных вызовов в современном машинном обучении.
Содержание
ВВЕДЕНИЕ
ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
1 Общие сведения
2 Аналоги
3 Выводы по разделу
ПРОЕКТИРОВАНИЕ СИСТЕМЫ
1. Текущее представление бизнес-процессов
2 Оптимизация бизнес-процессов с учётом разрабатываемого приложения
3. Структурная схема программно-аппаратной архитектуры
4. Стек используемых технологий
5. Выводы по разделу
Разработка программного обеспечения
1 Проектирование архитектуры системы
2. Разработка базы данных
3. Разработка облачного хранилища на основе MinIO
4. Разработка прототипа системы
5. Планы по дальнейшему направлению работ
6. Выводы по разделу
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Приложения
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Ticknor, J. (2015). Guide to Convolutional Neural Networks: A Practical Application to Traffic-Sign Detection and Classification. Springer International Publishing.
2. Chollet, F. (2018). Deep Learning with Python. Manning Publications Co.
3. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
4. Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. The MIT Press.
5. Bishop, C. M. (2006). Pattern Recognition and Machine Learning (Information Science and Statistics). Springer-Verlag New York.
6. Label Studio - https://labelstud.io/
7. FastAPI Documentation - https://fastapi.tiangolo.com/
8. Docker Documentation - https://docs.docker.com/
9. Kaggle: Your Home for Data Science - https://www.kaggle.com/
10. Image database ImageNet - http://www.image-net.org
11. Нейронные сети для начинающих - https://habr.com/ru/post/312450/
12. LabelImg. Open annotation tool - https://github.com/tzutalin/labelImg
13. RectLabel. An image annotation tool to label images for bounding box object detection and segmentation - https://rectlabel.com/
14. Computer Vision Annotation Tool (CVAT) - https://github.com/opencv/cvat
15. Anno-Mage: A semi-automatic Image Annotation Tool - https://github.com/virajmavani/semi-auto-image-annotation-tool/
16. Labelbox: The best way to create and manage training data - https://www.labelbox.com/
17. James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning: with Applications in R. Springer.
18. Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
В дипломном проекте клиентская часть будет реализовывать веб-интерфейс для загрузки изображений, создания и редактирования маркеров и аннотаций на изображениях, а также управления учетной записью пользователя. Серверная часть будет обеспечивать взаимодействие между клиентской частью и базой данных, включая функции авторизации и регистрации пользователей, загрузки изображений и метаданных, создания, редактирования и удаления маркеров и аннотаций на изображениях, а также получение списка изображений с маркерами и аннотациями. База данных будет использовать PostgreSQL для хранения данных.Проект будет иметь модульную структуру, позволяющую легко расширять функциональность и масштабировать проект при необходимости. Компоненты нашего проекта будут связаны между собой, обеспечивая полное взаимодействие между клиентской частью, серверной частью и базой данных.В целом, дипломный проект предоставляет удобный и простой интерфейс для разметки изображений, позволяя пользователям быстро и эффективно создавать различные маркеры и аннотации на изображениях. Благодаря использованию современных технологий проект будет быстрым, надежным и масштабируемым, позволяя легко адаптироваться к изменениям в требованиях пользователей и развивать его в будущем.