ANALISA LINEAR REGRESSION DAN TIME SERIES (FORECASTING) PADA PEMESANAN TIKET APLIKASI GOERS DI TAMAN MINI INDONESIA (TMII) DENGAN METODE CRISP-DM
- Python 3.12+
- Streamlit
- Scikit-learn
- Pandas
- NumPy
- Plotly
- Requests
git clone [URL_REPOSITORY_ANDA]
cd [NAMA_FOLDER_PROJECT]# Windows
python -m venv venv
venv\Scripts\activate
# Linux/Mac
python3 -m venv venv
source venv/bin/activatepip install -r requirements.txtstreamlit run main.pyData yang digunakan mencakup:
Aplikasi menggunakan pendekatan CRISP-DM:
Aplikasi terdiri dari 4 tab utama:
streamlit>=1.28.0
pandas>=2.0.0
numpy>=1.24.0
scikit-learn>=1.2.0
requests>=2.31.0
plotly>=5.18.0
Silakan berkontribusi dengan:
- Fork repository
- Buat branch baru (
git checkout -b fitur-baru) - Commit perubahan (
git commit -m 'Menambah fitur baru') - Push ke branch (
git push origin fitur-baru) - Buat Pull Request
- Streamlit untuk framework visualisasi
- Scikit-learn untuk tools machine learning
Forecasting adalah proses memprediksi nilai masa depan berdasarkan data historis. Salah satu model yang digunakan adalah arima (AutoRegressive Integrated Moving Average).
- ARIMA(p, d, q)
- p: orde autoregresi
- d: orde diferensiasi
- q: orde moving average
- AR (Autoregressive): model regresi linier
- I (Integrated): diferensiasi data
- MA (Moving Average): model rata-rata bergerak
R² = 1 - (SSres / SStot)
Dimana:
- SSres (Jumlah Kuadrat Residual) = Σ(y - ŷ)²
- SStot (Jumlah Kuadrat Total) = Σ(y - ȳ)²
- Rentang nilai: 0-1
- R² = 1: model sempurna
- R² = 0: model tidak lebih baik dari rata-rata
MSE = (1/n) * Σ(y - ŷ)²
Mengukur rata-rata kesalahan kuadrat prediksi
- Hubungan antara X dan Y harus bersifat linear
- Dapat diverifikasi dengan scatter plot dan residual plot
- Setiap observasi harus independen
- Penting untuk data time series
- Dapat diuji dengan Durbin-Watson test
- Varians error harus konstan
- Diperiksa dengan residual plot
- Pelanggaran dapat menyebabkan estimasi tidak efisien
- Residual harus berdistribusi normal
- Diuji dengan:
- Q-Q plot
- Uji Shapiro-Wilk
- Uji Kolmogorov-Smirnov
- β₁ positif: tren ekspor meningkat
- β₁ negatif: tren ekspor menurun
- Besaran β₁: kecepatan perubahan
- Asumsi tren linear mungkin tidak selalu tepat
- Tidak dapat menangkap perubahan musiman kompleks
- Sensitif terhadap outlier
- R² tinggi: prediksi lebih dapat diandalkan
- R² rendah: perlu pertimbangan faktor lain
- Berguna untuk membandingkan reliabilitas prediksi antar komoditas
- Sumber: API BPS
- Periode: 2022-2023
- Format: JSON terstruktur
- Pembersihan data
- Penanganan nilai hilang
- Standardisasi format
- Pembuatan model per komoditas
- Validasi asumsi
- Kalibrasi parameter
- Pengujian akurasi
- Validasi silang
- Analisis residual
- Grafik tren
- Tabel prediksi
- Metrik performa