251
Oleh: Bernardus Ari Kuncoro
Ini adalah copywriting concept untuk salah satu postingan di iykra_id. Saya mengangkat topik Label Spreading yang sempat saya tulis di postingan ini.
Slide 1
Anak data: “Gimana ya Min, aku mau bikin model klasifikasi, tapi banyak data nggak ada label-nya?”
Mimin: “Aha, bisa jadi kamu belum kenal sama metode yang satu ini, bro!”
Yuk, kenalan sama **Label Spreading! **
Sumber: https://machinelearningmastery.com/semi-supervised-learning-with-label-spreading/
Slide 2
Label Spreading merupakan salah satu contoh pendekatan semi-supervised learning untuk model prediksi klasifikasi.
Algoritme ini diperkenalkan oleh Dengyong Zhou, et al. pada sebuah paper tahun 2003
berjudul “Learning with Local and Global Consistency”.
Sumber: https://proceedings.neurips.cc/paper/2003/file/87682805257e619d49b8e0dfdc14affa-Paper.pdf
” The key to semi-supervised learning problems is the prior assumption of consistency, which means: (1) nearby points are likely to have the same label; and (2) points on the same structure typically referred to as a cluster or a manifold) are likely to have the same label. “
— Learning With Local And Global Consistency, 2003.
Slide 3
Gimana sih Label Spreading ini bekerja? Ada empat langkah besar.
- Tentukan hubungan antar datapoint. Kamu dapat menyebutnya Matriks W dengan rumus berikut.
https://miro.medium.com/max/1400/1*lYDgHEgsz7QUV79Z0DDfKQ.png
sehingga nanti akan ada matriks W, atau yang kamu bisa sebut sebagai matriks affinity berikut:
https://miro.medium.com/max/1400/1*qocL-rJYrCx9AzFQbGmhTw.png
- Buat matriks graph Laplacian yang akan membuat matriks W ternormalisasi secara simetris.
https://miro.medium.com/max/1400/1*UxSvk8fzLRjMaVjSobxLmA.png
- Gunakan matriks hasil kedua untuk menentukan matriks F yang berisi vektor label.
https://miro.medium.com/max/1400/1*EoipN-5dPDvgew_vMyaT3g.png
- Lakukan langkah 3 sampai terkonvergen atau mencapai iterasi maksimum. Sehingga label yang kosong bisa terisi.
Slide 4
Label Spreading ini ada di scikit-learn dengan LabelSpreading Class. Penggunaannya seperti apa?
Slide 5
Kenapa mesti repot-repot pakai semi-supervised learning?
Simply karena di dunia nyata, nggak semua data training berlabel itu tersedia. Label mesti di-generate. Bisa secara manual atau otomatis seperti ini.
Slide 6
Well, Ikuti terus postingan @iykra_id, ya!
Silakan like, komen, dan share ke teman-teman tersayang.
Biar Mimin makin semangat bikin konten.
Hasilnya jadi seperti ini:
Kalideres, 21 Desember 2021