Разработка методики обнаружения фишинга в электронных письмах

Скачать дипломную работу на тему: Разработка методики обнаружения фишинга в электронных письмах. В которой определены методы NLP для определения фишингового письма. Изучено исследование существующих методов обнаружения фишинга.
Author image
Ekaterina
Тип
Дипломная работа
Дата загрузки
11.01.2025
Объем файла
493 Кб
Количество страниц
49
Уникальность
Неизвестно
Стоимость работы:
2000 руб.
2500 руб.
Заказать написание работы может стоить дешевле

ВВЕДЕНИЕ

Мы живем в эпоху, где информация стала одним из самых ценных ресурсов. В современном мире цифровизация и глобализация открыли широкие возможности для обмена информацией, обучения, работы и общения. Однако, эти возможности пришли с новыми угрозами и вызовами для информационной безопасности. Среди них, одним из наиболее распространенных и зловредных методов атаки является фишинг.Фишинг – это форма киберпреступления, при котором злоумышленники, маскируясь под доверенные источники, пытаются обмануть пользователей и заставить их раскрыть свои конфиденциальные данные [1]. Со временем тактики фишинга стали все более изощренными и сложными для обнаружения. Эта проблема усугубилась во время пандемии COVID-19, когда использование онлайн-платформ и интернет-активность в целом значительно увеличились [2].

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
Изучение предметной области и ее описание
1. Описание предметной области
2. Цели и задачи
3. Машинное обучение
3.1. Подразделы машинного обучения
3.2. Обработка естественного языка
Исследование существующих методов обнаружения фишинга
1. Методы машинного обучение
2. Методы NLP для определения фишингового письма.
2.1. Классификация текста
2.2 Обучение с учителем и без учителя
2.3. Анализ семантики
2.4. Синтаксический анализ
2.5. Использование эмбеддингов слов
2.6. Трансформеры и предобученные модели
2.7. Комбинация методов
Выбор программных средств
1. Выбор языка программирования
2. Выбор библиотек
Сбор и обработка данных
1 Сбор данных
2. Обработка данных
Разработка и обучение модели
1. Глубокое обучение
2. Обработка естественного языка
3. Модели классификации
4. Оценка моделей
5. Настройка модели
6. Оценка качества модели
ЗАКЛЮЧЕНИЕ
Библиографический список

Список литературы

ADDIN ZOTERO_BIBL {"uncited":[],"omitted":[],"custom":[]} CSL_BIBLIOGRAPHY 1.Phishing – Libraesva Docs [Electronic resource]. URL: https://docs.libraesva.com/glossary/phishing/ (accessed: 14.06.2023).
2.Who is most vulnerable to cybercrime: new report reveals surprising insights [Electronic resource] // Cybernews. 2021. URL: https://cybernews.com/security/who-is-most-vulnerable-to-cybercrime-new-report-reveals-surprising-insights/ (accessed: 13.06.2023).
3.Основы Natural Language Processing для текста [Electronic resource] // Хабр. 2019. URL: https://habr.com/ru/companies/Voximplant/articles/446738/ (accessed: 13.06.2023).
4.Полное руководство по фишинговым атакам / Хабр [Electronic resource]. URL: https://habr.com/ru/companies/varonis/articles/544140/ (accessed: 13.06.2023).
5.Что такое машинное обучение? | Определение, типы и примеры | SAP Insights [Electronic resource] // SAP. URL: https://www.sap.com/cis/products/artificial-intelligence/what-is-machine-learning.html (accessed: 13.06.2023).
6.Искусственный интеллект: преимущества и сомнения [Electronic resource] // Хабр. 2021. URL: https://habr.com/ru/companies/ipmatika/articles/566690/ (accessed: 13.06.2023).
7.Что такое машинное обучение? – Описание корпоративного руководства по машинному обучению – AWS [Electronic resource] // Amazon Web Services, Inc. URL: https://aws.amazon.com/ru/what-is/machine-learning/ (accessed: 14.06.2023).
8.Гаврилов от А. Машинное обучение: что это, для чего оно нужно и как его применять [Electronic resource] // Checkroi. 2021. URL: https://checkroi.ru/blog/mashinnoe-obuchenie-chto-eto-takoe/ (accessed: 13.06.2023).
9.GeekBrains Р. сайта. Машинное обучение: типы, краткая история и принцип работы [Electronic resource] // GeekBrains. 2021. URL: https://gb.ru/blog/maschinnoe-obuchenie/ (accessed: 13.06.2023).
10.Vaswani A. et al. Attention Is All You Need: arXiv:1706.03762. arXiv, 2017.

Лингвистическое аннотирование – это процесс присвоения лингвистической информации текстовым данным с целью их структурирования и анализа. Оно включает различные уровни анализа, такие как морфологический, синтаксический и семантический.Морфологическое аннотирование включает в себя разметку лексических и грамматических характеристик каждого слова в тексте, таких как часть речи, число, падеж.Синтаксическое аннотирование состоит в определении синтаксических отношений между словами в предложении и разметке структурных элементов, таких как фразы, зависимости и деревья разбора.Семантическое аннотирование включает в себя определение значения и смысла выражений в тексте, а также разметку семантических ролей, связей между словами и лексических полей.Цель лингвистического аннотирования заключается в создании аннотированных корпусов, которые могут быть использованы для обучения и оценки компьютерных моделей в области обработки естественного языка, таких как модели машинного обучения. Аннотированные данные предоставляют дополнительную информацию о структуре и смысле текста, что позволяет более точно и глубоко анализировать естественный язык и разрабатывать более эффективные алгоритмы и модели для его обработки.Статистические методы – подходы, основанные на анализе частоты и распределения слов и фраз в тексте, которые часто используются для задач, таких как определение тематики текста или автоматическое суммирование.Все эти подходы можно использовать отдельно или в сочетании с машинным обучением для решения задач NLP. Однако стоит заметить, что машинное обучение и глубокое обучение демонстрируют значительное преимущество в решении многих сложных задач NLP, особенно когда требуется понимание контекста и сложных семантических отношений.