APA ITU LABEL SPREADING?

251

Oleh: Bernardus Ari Kuncoro

Ini adalah copywriting concept untuk salah satu postingan di iykra_id. Saya mengangkat topik Label Spreading yang sempat saya tulis di postingan ini.

Slide 1

Anak data: “Gimana ya Min, aku mau bikin model klasifikasi, tapi banyak data nggak ada label-nya?”

Mimin: “Aha, bisa jadi kamu belum kenal sama metode yang satu ini, bro!”

Yuk, kenalan sama **Label Spreading! **

Sumber: https://machinelearningmastery.com/semi-supervised-learning-with-label-spreading/

Slide 2

Label Spreading merupakan salah satu contoh pendekatan semi-supervised learning untuk model prediksi klasifikasi.

Algoritme ini diperkenalkan oleh Dengyong Zhou, et al. pada sebuah paper tahun 2003
berjudul “Learning with Local and Global Consistency”.

Sumber: https://proceedings.neurips.cc/paper/2003/file/87682805257e619d49b8e0dfdc14affa-Paper.pdf

The key to semi-supervised learning problems is the prior assumption of consistency, which means: (1) nearby points are likely to have the same label; and (2) points on the same structure typically referred to as a cluster or a manifold) are likely to have the same label.

— Learning With Local And Global Consistency, 2003.

Slide 3

Gimana sih Label Spreading ini bekerja? Ada empat langkah besar.

  1. Tentukan hubungan antar datapoint. Kamu dapat menyebutnya Matriks W dengan rumus berikut.

https://miro.medium.com/max/1400/1*lYDgHEgsz7QUV79Z0DDfKQ.png

sehingga nanti akan ada matriks W, atau yang kamu bisa sebut sebagai matriks affinity berikut:

https://miro.medium.com/max/1400/1*qocL-rJYrCx9AzFQbGmhTw.png

  1. Buat matriks graph Laplacian yang akan membuat matriks W ternormalisasi secara simetris.

https://miro.medium.com/max/1400/1*UxSvk8fzLRjMaVjSobxLmA.png

  1. Gunakan matriks hasil kedua untuk menentukan matriks F yang berisi vektor label.

https://miro.medium.com/max/1400/1*EoipN-5dPDvgew_vMyaT3g.png

  1. Lakukan langkah 3 sampai terkonvergen atau mencapai iterasi maksimum. Sehingga label yang kosong bisa terisi.

Slide 4

Label Spreading ini ada di scikit-learn dengan LabelSpreading Class. Penggunaannya seperti apa?

Slide 5

Kenapa mesti repot-repot pakai semi-supervised learning?
Simply karena di dunia nyata, nggak semua data training berlabel itu tersedia. Label mesti di-generate. Bisa secara manual atau otomatis seperti ini.

Slide 6

Well, Ikuti terus postingan @iykra_id, ya!
Silakan like, komen, dan share ke teman-teman tersayang.
Biar Mimin makin semangat bikin konten.

Hasilnya jadi seperti ini:

Kalideres, 21 Desember 2021

Wanna support me?

Leave a Reply

Your email address will not be published. Required fields are marked *