Makine öğrenmesi algoritmaları ile borsa verilerinin tahminlenmesi

Yükleniyor...
Küçük Resim

Tarih

2023

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

İzmir Bakırçay Üniversitesi Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Borsa endeks verileri finansal zaman serileri içerisinde önemli bir yere sahiptir. Bu tezin amacı, Borsa İstanbul 100 endeks (BİST 100) değerinin tahminlenmesidir. Bu amaç doğrultusunda tezde, makine öğrenmesi algoritmalarından Karar Ağacı, k-En Yakın Komşuluk (k-EYK), Rassal Orman, Aşırı Rassallaştırılmış Ağaçlar, Adaptif Yükseltme, Oylama ve Torbalama algoritmaları kullanılmıştır. Çalışmada BİST 100 günlük kapanış verilerini içeren 02.01.2013-28.10.2021 yılları arasındaki 2214 iş gününden oluşan bir veri seti kullanılmıştır. Geliştirilen modelde bir sonraki günün BİST 100 değeri için tahminleme gerçekleştirilmiştir. Algoritmalarının tahmin performanslarını değerlendirmek için ortalama karesel hata (OKH), hata kareler ortalamasının karekökü (KOKH), ortalama mutlak hata (OMH) ve belirlilik katsayısı (R2) ölçütleri kullanılmıştır. Sonuç olarak, Rassal Orman ve Torbalama algoritmaları için R2 değeri0,87, Adaptif Yükseltme, Aşırı Rassallaştırılmış Ağaçlar ve Oylama algoritmaları için ise R2 değeri 0,88'dir. Bununla birlikte geleneksel makine öğrenmesi algoritmaları Karar Ağacı ve K-EYK algoritmalarının 0,84 ve 0,83 değerleri ile topluluk öğrenme algoritmalarına göre daha düşük bir tahmin performansı göstermiştir. Tez kapsamında elde edilen sonuçlar BİST 100 değerlerinin zaman serileri ile modellenerek yüksek bir başarım ile tahminlenebileceğini göstermektedir.
Stock market index data has an important place in financial time series. The aim of this thesis is to forecast the value of the Borsa İstanbul 100 index. For this purpose, machine learning algorithms Decision Tree, k-Nearest Neighbors (k-EYK), Random Forest, Extra Trees, AdaBoost, Voting, and Bagging algorithms were used in the thesis. A data set consisting of 2214 business days between 02.01.2013 and 28.10.2021, which includes BIST 100-day closing data, was used. In the developed model, estimations were made for the BIST 100 value of the next day. In order to evaluate the prediction performances of the algorithms, the mean square error, the root mean square error, the mean absolute error and the coefficient of determination criteria were used. As a result, the R2 value for the Random Forest and Bagging algorithms is 0,87, and the R2 value for the AdaBoost, Extra Trees, and Voting algorithms is 0,88. However, traditional machine learning algorithms showed lower prediction performance than ensemble learning algorithms with 0,84 and 0,83 R2 values of Decision Tree and K-EYK algorithms. The results show that BIST 100 values can be estimated with high performance by modeling with time series.

Açıklama

Anahtar Kelimeler

Mühendislik Bilimleri, Engineering Sciences

Künye

Koleksiyon