Анализ зависимостей политических взглядов на примере отдельных групп сообществ в социальной сети ВКонтакте
Введение
В современном мире, социальные сети играют значительную роль в информационном пространстве, особенно среди молодёжи. Молодежь - одна из крупных социально-демографических групп современного российского населения. Молодежь проводит большую часть своего времени в социальных сетях, а доля молодёжи, которая не пользуется телефоном и Интернетом и вовсе мизерная. Молодёжь также является легко манипулируемой частью населения, ведь неокрепшими умами можно с легкостью управлять посредством пропаганды, что может привести к формированию неправильных взглядов. В связи с этим, на сегодняшний день проблема анализа социальных сетей, в том числе и их сообществ, остро стоит на повестке дня.Важно отметить, что разные сообщества в социальных сетях могут окрашивать новости, соблюдая свою политическую почву. Новости могут быть окрашены либо в одну, либо в другую диаметрально противоположную сторону. Как пример, можно рассмотреть политические новости.
Содержание
Введение
Литературный обзор
Вывод по литературному обзору
Исследовательский раздел
1 Выбор сообществ
2 Сбор данных
3 Предварительная обработка данных
3.1 Токенизация
3.2 Лемматизация
3.3 Стоп-слова
3.4 Стемминг
4 Словари
4.1 КартаСловСент
4.2 Анализ смайликов в тексте
5 Анализ предложений
5.1 Полученные результаты новостей
5.2 Полученные результаты политических новостей
Вывод по исследованию
Исследовательская часть
1 Использованные технологии
1.1 Библиотека VK
1.2 Библиотека NTLK
1.3 Библиотека pymystem3
1.4 Библиотека pandas
1.5 Библиотеки для обработки эмодзи
1.6 Использование встроенных библиотек
2 Разработанные функции
2.1 Получение словаря
2.2 Получение постов из сообщества
2.3 Предобработка текста
2.4 Получение сентимента эмодзи
2.5 Сентимент-анализ
2.6 Основная функция
2.7 Сохранение результатов
Экономический раздел
1 Расчет сметы затрат на проведение исследования
2 Расчет материальных затрат
3 Расчёт затрат на оплату труда
4 Амортизационные отчисления
5 Прочие расходы
6 Цена на разработку
7 Составление календарного графика выполнения работы
8 Выводы по разделу
Список использованных источников
ПРИЛОЖЕНИЕ А
Список использованных источников
Gunda A., Teratipally V. Sentiment Analysis of Political News articles and the effect of negation scope //International Research Journal of Engineering and Technology (IRJET). – 2016. – Т. 3. – С. 1105.;
Moshkin V., Yarushkina N., Andreev I. The sentiment analysis of unstructured social network data using the extended ontology SentiWordNet //2019 12th International Conference on Developments in eSystems Engineering (DeSE). – IEEE, 2019. – С. 576-580.;
Samuels A., Mcgonical J. News sentiment analysis //arXiv preprint arXiv:2007.02238. – 2020.;Truică C. O. et al. Topic-based document-level sentiment analysis using contextual cues //Mathematics. – 2021. – Т. 9. – №. 21. – С. 2722.;Hamed S. K., Ab Aziz M. J., Yaakub M. R. Fake News Detection Model on Social Media by Leveraging Sentiment Analysis of News Content and Emotion Analysis of Users’ Comments //Sensors. – 2023. – Т. 23. – №. 4. – С. 1748.;Drus Z., Khalid H. Sentiment analysis in social media and its application: Systematic literature review //Procedia Computer Science. – 2019. – Т. 161. – С. 707-714;
ПАТРИОТЫ РОССИИ [Электронный ресурс] – URL: https://vk.com/russia.patriots (дата обращения 10.05.2023);
Статистика аккаунтов в социальных сетях [Электронный ресурс] – URL: https://jagajam.com/ (дата обращения 10.05.2023);
НАШИ НОВОСТИ [Электронный ресурс] – URL: https://vk.com/nashynov (дата обращения 10.05.2023);
Рифмы и Панчи [Электронный ресурс] – URL: https://vk.com/rhymes (дата обращения 10.05.2023);
Welcome to Python.org [Электронный ресурс] – URL: https://www.python.org/ (дата обращения 10.05.2023);
vk 3.0 [Электронный ресурс] – URL: https://pypi.org/project/vk/ (дата обращения 10.05.2023);
Получить access token [Электронный ресурс] – URL: https://vkhost.github.io/ (дата обращения 10.05.2023);
Natural Language Toolkit [Электронный ресурс] – URL: https://www.nltk.org/ (дата обращения 10.05.2023).
Исходя из проведённого анализа литературы в данной тематике, было выявлено огромное количество способов сентимент-анализа новостей. Анализ литературы свидетельствует о том, что способы анализа тональности, связанные с машинным обучением, стали появляться относительно недавно, с развитием вычислительных мощностей, тогда как подходы по окрашиванию новостей на основе словарей существуют уже давно, и постоянно улучшаются.Анализ тональностей используется в различных областях, в том числе, в области поиска мнений, и только набирает популярность в настоящее время. Все вышеперечисленные методы анализа тональности имеют общие черты, такие, как, например, предварительная обработка текстов, которая не только упрощает вычисления, но также и повышает точность алгоритмов.Ознакомившись с существующими статьями, можно сделать вывод, что анализ тональности текста, а в особенности комментариев людей, очень развит в англоязычных социальных сетях. Существует множество готовых решений по анализу тональностей текстов на английском языке. Значительно меньше развит русскоязычный сектор, и сентимент-анализ русского языка. В связи с этим, будет актуально проводить исследование настроений в социальной сети ВКонтакте, особенно в области политических взглядов и предпочтений пользователей.
-