226
Oleh: Bernardus Ari Kuncoro
Yuk, kenalan sama Label Spreading!
Label Spreading merupakan salah satu contoh pendekatan semi-supervised learning untuk model prediksi klasifikasi.
Algoritme ini diperkenalkan oleh Dengyong Zhou, et al. pada sebuah paper tahun 2003
berjudul “Learning with Local and Global Consistency”.
Sumber: https://proceedings.neurips.cc/paper/2003/file/87682805257e619d49b8e0dfdc14affa-Paper.pdf
The key to semi-supervised learning problems is the prior assumption of consistency, which means: (1) nearby points are likely to have the same label; and (2) points on the same structure typically referred to as a cluster or a manifold) are likely to have the same label.
— Learning With Local And Global Consistency, 2003.
Gimana sih Label Spreading ini bekerja?
- Tentukan hubungan antar datapoint. Kita dapat menyebutnya Matriks W dengan rumus berikut.
sehingga nanti akan ada matriks W, atau yang kita sebut sebagai matriks affinity berikut:
- Buat matriks graph Laplacian yang akan membuat matriks W ternormalisasi secara simetris.
- Gunakan matriks hasil kedua untuk menentukan matriks F yang berisi vektor label.
- Lakukan langkah 3 sampai terkonvergen atau mencapai iterasi maksimum. Sehingga label yang kosong bisa terisi.
Dalam Python, Label Spreading ini ada di scikit-learn dengan LabelSpreading Class. Penggunaannya seperti apa?
Silakan cek sendiri di sini ya.
Kenapa mesti repot-repot pakai semi-supervised learning?
Simply, karena di dunia nyata, nggak semua data training berlabel itu tersedia. Label mesti di-generate. Bisa secara manual atau otomatis seperti ini.
Sumber: https://machinelearningmastery.com/semi-supervised-learning-with-label-spreading/
Kalideres, 25 November 2021