Mengenal Algoritme Label Spreading

226

Oleh: Bernardus Ari Kuncoro

Yuk, kenalan sama Label Spreading!

Label Spreading merupakan salah satu contoh pendekatan semi-supervised learning untuk model prediksi klasifikasi.

Algoritme ini diperkenalkan oleh Dengyong Zhou, et al. pada sebuah paper tahun 2003
berjudul “Learning with Local and Global Consistency”.

Sumber: https://proceedings.neurips.cc/paper/2003/file/87682805257e619d49b8e0dfdc14affa-Paper.pdf

The key to semi-supervised learning problems is the prior assumption of consistency, which means: (1) nearby points are likely to have the same label; and (2) points on the same structure typically referred to as a cluster or a manifold) are likely to have the same label.

— Learning With Local And Global Consistency, 2003.

Gimana sih Label Spreading ini bekerja?

  1. Tentukan hubungan antar datapoint. Kita dapat menyebutnya Matriks W dengan rumus berikut.

sehingga nanti akan ada matriks W, atau yang kita sebut sebagai matriks affinity berikut:

  1. Buat matriks graph Laplacian yang akan membuat matriks W ternormalisasi secara simetris.
  1. Gunakan matriks hasil kedua untuk menentukan matriks F yang berisi vektor label.
  1. Lakukan langkah 3 sampai terkonvergen atau mencapai iterasi maksimum. Sehingga label yang kosong bisa terisi.

Dalam Python, Label Spreading ini ada di scikit-learn dengan LabelSpreading Class. Penggunaannya seperti apa?

Silakan cek sendiri di sini ya.

Klik di sini

Kenapa mesti repot-repot pakai semi-supervised learning?
Simply, karena di dunia nyata, nggak semua data training berlabel itu tersedia. Label mesti di-generate. Bisa secara manual atau otomatis seperti ini.

Sumber: https://machinelearningmastery.com/semi-supervised-learning-with-label-spreading/

Kalideres, 25 November 2021

Wanna support me?

Follow by Email
LinkedIn
Share