Monte Carlo vs K-Fold Cross Validation

213

Oleh: Bernardus Ari Kuncoro

Cross Validation (CV) merupakan metode yang berfungsi buat ngecek performa dua atau lebih variasi model kalian. Buat yang sering bikin model, pasti kenal dua metode CV ini.Yuk, disimak.

1. Monte Carlo Cross Validation

Langkah-langkah:
a. Bagi data training dan data testing (Bisa 70:30, 60:40, atau 80:20, proporsinya terserah kamu, bisa di-random)
b. Fit model dengan data training dan hitung error nya dengan data testing
c. Lakukan iterasi sebanyak 100, 200, bahkan 1000 kali.

2. K-Fold Cross Validation
a. Bagi data training dan data testing menjadi K-bagian.
b. Fit model untuk data training sebanyak (K-1) itu
c. Lakukan iterasi sebanyak K kali. Biasanya K itu bernilai antara 1 s.d. 5

Perbedaan antara Monte Carlo dan K-Fold Cross Validation:
Monte Carlo vs K-Fold Cross Validation
Data training bisa berulang | Data training pasti tidak akan berulang
Pembagian data tidak terbatas | Pembagian data dibatasi oleh nilai K
Bias tinggi, varians rendah | Bias rendah, varians tinggi

Referensi gambar: https://miro.medium.com/max/700/1*H2usIsz3G0_Kw1PihhB3Eg.png

Sumber: https://towardsdatascience.com/cross-validation-k-fold-vs-monte-carlo-e54df2fc179b

Kalideres, 12 November 2021

Wanna support me?

Follow by Email
LinkedIn
Share