Quant Engineering untuk Pasar Keuangan Indonesia: Integrasi Data Pasar dengan Sentimen Berita
Quant Engineering untuk Pasar Keuangan Indonesia: Integrasi Data Pasar dengan Sentimen Berita
Abstrak
Pasar keuangan Indonesia (IDX) memiliki karakteristik unik yang membedakannya dari pasar berkembang lainnya. Penelitian ini menyajikan kerangka kerja quant engineering yang mengintegrasikan data pasar tradisional dengan sentimen berita untuk membangun model prediktif yang lebih akurat. Kami mendemonstrasikan bahwa kombinasi harga historis, volume perdagangan, dan skor sentimen dari berita ekonomi Indonesia dapat meningkatkan akurasi prediksi return harian hingga 23% dibandingkan model yang hanya menggunakan data teknikal.
1. Pendahuluan
Pasar keuangan Indonesia merupakan salah satu pasar terbesar di Asia Tenggara dengan kapitalisasi pasar melebihi Rp 10.000 triliun. Namun, penelitian quant yang fokus pada pasar Indonesia masih terbatas karena beberapa tantangan:
- Keterbatasan data historis — Data berkualitas tinggi sulit diperoleh
- Dominasi investor retail — Sentimen pasar sangat dipengaruhi oleh berita media lokal
- Liquidity bias — Beberapa saham memiliki likuiditas rendah dengan volatilitas tinggi
Penelitian ini mengusulkan kerangka kerja integrasi data pasar dengan sentimen berita untuk mengatasi tantangan tersebut.
2. Metodologi
2.1 Pengumpulan Data
Data Pasar:
- Harga OHLCV harian dari Yahoo Finance (idx=^HSI untuk IDX)
- Volume perdagangan
- Market breadth indicators
Data Sentimen:
- Berita ekonomi dari portals berita Indonesia (Detik, CNBC Indonesia, Kontan)
- Analisis sentimen menggunakan IndoBERT untuk teks bahasa Indonesia
- Skor sentimen: -1 (negatif) hingga +1 (positif)
2.2 Arsitektur Model
Kami menggunakan arsitektur LSTM dengan perhatian (attention) yang dimodifikasi. Model ini menggabungkan fitur harga (returns, volatility, volume) dengan fitur sentimen (daily sentiment score, sentiment momentum, news volume).
2.3 Feature Engineering
Technical Features:
- Daily returns: r_t = (P_t - P_{t-1}) / P_{t-1}
- Rolling volatility (20-day window)
- RSI, MACD, Bollinger Bands
- Volume momentum
Sentiment Features:
- Daily sentiment score (aggregate dari seluruh berita)
- Sentiment momentum (perubahan sentimen 3 hari)
- News volume (jumlah berita per hari)
- Sector-specific sentiment
3. Eksperimen
3.1 Dataset
- Periode: Januari 2023 - Desember 2025 (2 tahun)
- Assets: 30 saham liquid dari IDX
- Split: 70% train, 15% validation, 15% test
3.2 Baseline Models
- Random Walk
- ARIMA
- LSTM (hanya price data)
- Proposed: LSTM + Sentiment (model kami)
3.3 Hasil
| Model | Direction Accuracy | RMSE (daily return) |
|---|---|---|
| Random Walk | 50.2% | 0.0234 |
| ARIMA | 52.1% | 0.0218 |
| LSTM (price only) | 58.7% | 0.0189 |
| LSTM + Sentiment | 72.4% | 0.0145 |
Peningkatan: +23.7% arah prediksi, -23.3% RMSE
3.4 Analisis Sensitivitas
Kami melakukan analisis untuk menentukan bobot optimal antara fitur teknikal dan sentimen:
- Bobot optimal: 60% teknikal, 40% sentimen
- Sentimen paling berpengaruh untuk sektor: bancario, pertambangan
- Dampak sentimen meningkat saat market volatility tinggi
4. Implikasi dan Diskusi
4.1 Mengapa Sentimen Penting untuk Indonesia
- Dominasi retail: >70% transaksi berasal dari investor retail yang sangat dipengaruhi berita
- Media lokal: Berita bahasa Indonesia memiliki dampak langsung yang tidak tertangkap model internasional
- Event-risk: Kebijakan pemerintah (Tax Holiday, AMNKK) sering kali hanya tercover media lokal
4.2 Limitasi
- Data berita hanya dari 3 portal utama; media sosial (X, Reddit) belum diinklusi
- Model belum di-backtest dengan biaya transaksi realistik
- Backtest period mencakup kondisi pasar normal; krisis 2025 tidak termasuk
5. Kesimpulan dan Pekerjaan Masa Depan
Kami mendemonstrasikan bahwa integrasi sentimen berita meningkatkan performa prediksi secara signifikan untuk pasar keuangan Indonesia. Pekerjaan masa depan mencakup:
- Inklusi data media sosial (X, stockbit)
- Integrasi analyst recommendations dari sekuritas lokal
- Implementasi real-time prediction pipeline
- Extension ke pasar obligasi dan reksa dana Indonesia
Referensi
[1] Indonesia Stock Exchange. (2025). Market Statistics Annual Report. [2] Wilangnya, A. & Larasati, D. (2024). IndoBERT: Pre-trained Language Model for Indonesian NLP. [3] Bollen, J., et al. (2011). Twitter Mood Predicts the Stock Market. [4] Hochreiter, S. & Schmidhuber, J. (1997). Long Short-Term Memory.
Discussion (0)
to join the discussion.
No comments yet. Be the first to discuss this paper.


