Прогнозирование цен финансовых инструментов на основе комбинации нейросетевых моделей
Введение
Современный мир финансовых инвестиций характеризуется высокой степенью неопределенности и риска. Финансовые инструменты, такие как акции, облигации, валюты, сырьевые товары и другие, подвержены колебаниям цен, которые определяются различными факторами, такими как экономические условия, геополитическая обстановка и новости.
Прогнозирование цен на акции является одной из ведущих тем в финансовых исследованиях [1]. Данная тема сводится к исследованию сложных динамических систем, и является трудно формализуемой задачей. Прогноз таких систем должен опираться почти исключительно на выявлении скрытых закономерностей в накопленных данных.
Актуальность данной работы обусловлена возрастающим уровнем финансовой грамотности населения и, соответственно, постоянно растущим интересом к финансовому рынку [2]. Фондовый рынок на сегодняшний день открыт для широкого круга лиц, что приводит к ряду проблем.
Содержание
Введение7
1Анализ подходов к семантическому анализу новостного фона финансовых инструментов9
1.1Основные методы и виды классификации тональности9
1.2Метод представления слов в векторном виде — Word2Vec10
1.3Метод Bag Of Words14
1.4Transformers16
1.5Выводы19
2Анализ подходов к прогнозированию цен финансовых инструментов20
2.1 Основные методы и техники прогнозирования финансовых инструментов20
2.2 Simple Moving Average (SMA)22
2.3 Autoregressive integrated moving average (ARIMA)23
2.4 Random Forest (RF)24
2.5 Long short-term memory (LSTM)26
2.6Сравнительный анализ30
2.7Выводы36
3Прогнозирование комбинированным методом37
3.1 Постановка задачи37
3.2 Архитектура39
3.3 Парсинг данных40
3.4 Подготовка данных с новостями к работе с классификатором46
3.5 Сравнительный анализ48
4Разработка программного проекта «Онлайн-аналитика финансовых инструментов»53
4.1 Концепция программного продукта и границы проекта53
4.2 Описание требований к функционалу программного продукта55
4.3 Описание требований к функционалу программного продукта55
Заключение56
Список использованных источников58
Список использованных источников
Инвестиции [Электронный ресурс]. – Режим доступа: https://elar.urfu.ru/bitstream/10995/44099/1/978-5-7996-1978-7_2016.pdf, (дата обращения: 10.11.2022).
Обзор ключевых показателей профессиональных участников рынка ценных бумаг [Электронный ресурс]. – Режим доступа: https://www.cbr.ru/Collection/Collection/File/32068/review_secur_20.pdf, (дата обращения: 11.11.2022).
Инвестиционное поведение и инвестиционные ожидания российских начинающих инвесторов в крупных городах [Электронный ресурс]. – Режим доступа: https://www.cbr.ru/StaticHtml/File/41186/info_2021-10-06.pdf, (дата обращения: 11.11.2022).
Text mining and semantics [Электронный ресурс]. – Режим доступа: https://www.researchgate.net/publication/318168212_Text_mining_and_semantics_a_systematic_mapping_study, (дата обращения: 12.11.2022).
Current challenges and New Directions in Sentiment Analysis [Электронный ресурс]. – Режим доступа: https://arxiv.org/pdf/2005.00357.pdf, (дата обращения: 12.11.2022).
Language Dynamics analysis through Word2Vec Embeddings [Электронный ресурс] – Режим доступа: https://web.stanford.edu/class/archive/cs/cs224n/cs224n.1174/reports/2746841.pdf, (дата обращения: 13.11.2022).
Review of Text Vectorization Methods: Bag ofWords, Tf-Idf, Word2vec and Doc2vec [Электронный ресурс] – Режим доступа: https://slujst.com.ng/index.php/jst/article/download/266/115, (дата обращения: 14.11.2022).
Transformers Approach for Sentiment Analysis [Электронный ресурс] – Режим доступа: https://ceur-ws.org/Vol-3202/restmex-paper11.pdf, (дата обращения: 16.11.2022).
COMPRASSION OF MACHINE LEARNING FOR SENTIMENT ANALYSIS [Электронный ресурс] – Режим доступа: https://arxiv.org/ftp/arxiv/papers/2101/2101.06353.pdf, (дата обращения: 15.12.2022).
Нейрокомпьютинг и его применения в экономике и бизнесе [Электронный ресурс]. – Режим доступа https://www.studentlibrary.ru/book/intuit_157.html, (дата обращения: 25.05.2022).
Было выбрано 4 популярных и наиболее точных в своих подгруппах [12] метода технического анализа.
2.2 Simple Moving Average (SMA)Simple moving average (SMA) — это технический индикатор, который основывается на анализе поведения ценовых котировок ценной бумаги и их среднего значения, изменяющегося со временем (см. рисунок 2.1)
По своей сущности, данный метод представляет собой фильтр низкочастотной составляющей, что означает, что он пропускает низкочастотную активность (долгосрочные циклы и линии тренда), в то время как высокочастотные случайные колебания отсекаются. Простое скользящее среднее вычисляется по следующей формуле:
SMA= (P1+P2+P3…+Pn)nгде Pn представляет собой цену закрытия в определенном временном точке, а n представляет собой количество значений исходной функции (чем больше значений, тем более гладкий график получается при использовании данной функции).