Skip to content

Faisd405/tmii-ticket-order-analysis

Repository files navigation

Tugas Data Mining

ANALISA LINEAR REGRESSION DAN TIME SERIES (FORECASTING) PADA PEMESANAN TIKET APLIKASI GOERS DI TAMAN MINI INDONESIA (TMII) DENGAN METODE CRISP-DM

📋 Deskripsi

🚀 Fitur Utama

💻 Teknologi yang Digunakan

  • Python 3.12+
  • Streamlit
  • Scikit-learn
  • Pandas
  • NumPy
  • Plotly
  • Requests

📦 Cara Instalasi

1. Clone Repository

git clone [URL_REPOSITORY_ANDA]
cd [NAMA_FOLDER_PROJECT]

2. Buat Virtual Environment

# Windows
python -m venv venv
venv\Scripts\activate

# Linux/Mac
python3 -m venv venv
source venv/bin/activate

3. Install Dependencies

pip install -r requirements.txt

4. Jalankan Aplikasi

streamlit run main.py

📊 Struktur Data

Data yang digunakan mencakup:

📈 Metodologi

Aplikasi menggunakan pendekatan CRISP-DM:

📱 Tampilan Aplikasi

Aplikasi terdiri dari 4 tab utama:

⚙️ Requirements

streamlit>=1.28.0
pandas>=2.0.0
numpy>=1.24.0
scikit-learn>=1.2.0
requests>=2.31.0
plotly>=5.18.0

🤝 Kontribusi

Silakan berkontribusi dengan:

  1. Fork repository
  2. Buat branch baru (git checkout -b fitur-baru)
  3. Commit perubahan (git commit -m 'Menambah fitur baru')
  4. Push ke branch (git push origin fitur-baru)
  5. Buat Pull Request

🙏 Ucapan Terima Kasih

  • Streamlit untuk framework visualisasi
  • Scikit-learn untuk tools machine learning

📚 Teori dan Metodologi

1. Forecasting (Time Series)

Forecasting adalah proses memprediksi nilai masa depan berdasarkan data historis. Salah satu model yang digunakan adalah arima (AutoRegressive Integrated Moving Average).

Rumus Dasar:

  • ARIMA(p, d, q)
  • p: orde autoregresi
  • d: orde diferensiasi
  • q: orde moving average

Komponen ARIMA:

  • AR (Autoregressive): model regresi linier
  • I (Integrated): diferensiasi data
  • MA (Moving Average): model rata-rata bergerak

2. Evaluasi Model

1. R² (Koefisien Determinasi)

R² = 1 - (SSres / SStot)

Dimana:

  • SSres (Jumlah Kuadrat Residual) = Σ(y - ŷ)²
  • SStot (Jumlah Kuadrat Total) = Σ(y - ȳ)²
  • Rentang nilai: 0-1
    • R² = 1: model sempurna
    • R² = 0: model tidak lebih baik dari rata-rata

2. MSE (Mean Squared Error)

MSE = (1/n) * Σ(y - ŷ)²

Mengukur rata-rata kesalahan kuadrat prediksi

3. Asumsi Model

1. Linearitas

  • Hubungan antara X dan Y harus bersifat linear
  • Dapat diverifikasi dengan scatter plot dan residual plot

2. Independensi

  • Setiap observasi harus independen
  • Penting untuk data time series
  • Dapat diuji dengan Durbin-Watson test

3. Homoskedastisitas

  • Varians error harus konstan
  • Diperiksa dengan residual plot
  • Pelanggaran dapat menyebabkan estimasi tidak efisien

4. Normalitas

  • Residual harus berdistribusi normal
  • Diuji dengan:
    • Q-Q plot
    • Uji Shapiro-Wilk
    • Uji Kolmogorov-Smirnov

4. Implikasi untuk Prediksi Ekspor

1. Interpretasi Koefisien

  • β₁ positif: tren ekspor meningkat
  • β₁ negatif: tren ekspor menurun
  • Besaran β₁: kecepatan perubahan

2. Keterbatasan Model

  • Asumsi tren linear mungkin tidak selalu tepat
  • Tidak dapat menangkap perubahan musiman kompleks
  • Sensitif terhadap outlier

3. Penggunaan R²

  • R² tinggi: prediksi lebih dapat diandalkan
  • R² rendah: perlu pertimbangan faktor lain
  • Berguna untuk membandingkan reliabilitas prediksi antar komoditas

5. Proses Analisis Data

1. Pengumpulan Data

  • Sumber: API BPS
  • Periode: 2022-2023
  • Format: JSON terstruktur

2. Pra-pemrosesan

  • Pembersihan data
  • Penanganan nilai hilang
  • Standardisasi format

3. Pemodelan

  • Pembuatan model per komoditas
  • Validasi asumsi
  • Kalibrasi parameter

4. Evaluasi dan Validasi

  • Pengujian akurasi
  • Validasi silang
  • Analisis residual

5. Visualisasi dan Pelaporan

  • Grafik tren
  • Tabel prediksi
  • Metrik performa

About

Analisis data pemesanan tiket Taman Mini Indonesia Indah.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages