213
Oleh: Bernardus Ari Kuncoro
Cross Validation (CV) merupakan metode yang berfungsi buat ngecek performa dua atau lebih variasi model kalian. Buat yang sering bikin model, pasti kenal dua metode CV ini.Yuk, disimak.
1. Monte Carlo Cross Validation
Langkah-langkah:
a. Bagi data training dan data testing (Bisa 70:30, 60:40, atau 80:20, proporsinya terserah kamu, bisa di-random)
b. Fit model dengan data training dan hitung error nya dengan data testing
c. Lakukan iterasi sebanyak 100, 200, bahkan 1000 kali.
2. K-Fold Cross Validation
a. Bagi data training dan data testing menjadi K-bagian.
b. Fit model untuk data training sebanyak (K-1) itu
c. Lakukan iterasi sebanyak K kali. Biasanya K itu bernilai antara 1 s.d. 5
Perbedaan antara Monte Carlo dan K-Fold Cross Validation:
Monte Carlo vs K-Fold Cross Validation
Data training bisa berulang | Data training pasti tidak akan berulang
Pembagian data tidak terbatas | Pembagian data dibatasi oleh nilai K
Bias tinggi, varians rendah | Bias rendah, varians tinggi
Referensi gambar: https://miro.medium.com/max/700/1*H2usIsz3G0_Kw1PihhB3Eg.png
Sumber: https://towardsdatascience.com/cross-validation-k-fold-vs-monte-carlo-e54df2fc179b
Kalideres, 12 November 2021