APA ITU LABEL SPREADING?

251

Oleh: Bernardus Ari Kuncoro

Ini adalah copywriting concept untuk salah satu postingan di iykra_id. Saya mengangkat topik Label Spreading yang sempat saya tulis di postingan ini.

Slide 1

Anak data: “Gimana ya Min, aku mau bikin model klasifikasi, tapi banyak data nggak ada label-nya?”

Mimin: “Aha, bisa jadi kamu belum kenal sama metode yang satu ini, bro!”

Yuk, kenalan sama **Label Spreading! **

Sumber: https://machinelearningmastery.com/semi-supervised-learning-with-label-spreading/

Slide 2

Label Spreading merupakan salah satu contoh pendekatan semi-supervised learning untuk model prediksi klasifikasi.

Algoritme ini diperkenalkan oleh Dengyong Zhou, et al. pada sebuah paper tahun 2003
berjudul “Learning with Local and Global Consistency”.

Sumber: https://proceedings.neurips.cc/paper/2003/file/87682805257e619d49b8e0dfdc14affa-Paper.pdf

The key to semi-supervised learning problems is the prior assumption of consistency, which means: (1) nearby points are likely to have the same label; and (2) points on the same structure typically referred to as a cluster or a manifold) are likely to have the same label.

— Learning With Local And Global Consistency, 2003.

Slide 3

Gimana sih Label Spreading ini bekerja? Ada empat langkah besar.

  1. Tentukan hubungan antar datapoint. Kamu dapat menyebutnya Matriks W dengan rumus berikut.

https://miro.medium.com/max/1400/1*lYDgHEgsz7QUV79Z0DDfKQ.png

sehingga nanti akan ada matriks W, atau yang kamu bisa sebut sebagai matriks affinity berikut:

https://miro.medium.com/max/1400/1*qocL-rJYrCx9AzFQbGmhTw.png

  1. Buat matriks graph Laplacian yang akan membuat matriks W ternormalisasi secara simetris.

https://miro.medium.com/max/1400/1*UxSvk8fzLRjMaVjSobxLmA.png

  1. Gunakan matriks hasil kedua untuk menentukan matriks F yang berisi vektor label.

https://miro.medium.com/max/1400/1*EoipN-5dPDvgew_vMyaT3g.png

  1. Lakukan langkah 3 sampai terkonvergen atau mencapai iterasi maksimum. Sehingga label yang kosong bisa terisi.

Slide 4

Label Spreading ini ada di scikit-learn dengan LabelSpreading Class. Penggunaannya seperti apa?

Slide 5

Kenapa mesti repot-repot pakai semi-supervised learning?
Simply karena di dunia nyata, nggak semua data training berlabel itu tersedia. Label mesti di-generate. Bisa secara manual atau otomatis seperti ini.

Slide 6

Well, Ikuti terus postingan @iykra_id, ya!
Silakan like, komen, dan share ke teman-teman tersayang.
Biar Mimin makin semangat bikin konten.

Hasilnya jadi seperti ini:

Kalideres, 21 Desember 2021

DATA SCIENCE LEARNING PATH 2022

250

Oleh: Bernardus Ari Kuncoro

Tak bisa dipungkiri, Data Science jadi magnet skill berkekuatan besar. Selain karena lowongannya bertebaran di berbagai sektor, skill ini diperkirakan akan terus terpakai.

Buat Anda yang bukan dari background jurusan IT atau Statistik, nggak usah berkecil hati! Banyak kok Data Heroes IYKRA yang berlatarbelakang di luar jurusan tersebut.

Biar nggak bingung, ini dia

IYKRA’s recommendation for Junior Data Scientist’s Learning Path in 2022

Step 1 – Intro to Data Science (DS)

Step 2 – Data Viz (Tableau or Power BI)

Step 3 – Programming
Writing SQL
Python Programming for DS
UNIX Command

Step 4 – Statistics for DS

Step 5 – Exploratory Data Analysis

Step 6 –
Explainable Machine Learning (Supervised and Unsupervised Learning)
Model Deployment

Step 7 – Big Data Tools for DS

Step 8 – Business & Legal

The next step is performing Analytic Portfolio Project (APP) for Data Scientists with Real Clients!

Good Luck, Anak Data!

Well, ini konten saya buat copy-nya dan sudah dipercantik oleh tim Kreatif IYKRA dan sudah naik di sini.

Bagi Anda yang tertarik mendalami Data Science, silakan gabung di kelas online Data Science Foundation Udemy di sini.

Kalideres, 20 Desember 2021

Speech Outline for Data Fellowship Batch #6 Graduation

227

Oleh: Bernardus Ari Kuncoro

Hari ini, Jumat, 26 November 2021, saya diminta hadir oleh tim B2C IYKRA dalam acara Graduation.

Saya tidak menyiapkan script seperti pertama kali saya buat waktu di Data MBA. Hanya menggunakan pokok-pokok pembicaraan. Apa saja?

  1. Pembuka: Selamat kepada 10 Data Engineer dan 22 Data Scientist lulusan Data Fellowship IYKRA Batch 6
  2. Flashback tentang modul yang saya ajarkan: Business and Legal, serta Supervised Learning ++
  3. Pesan #1 Maintain curiousity level di level yang tinggi
  4. Pesan #2 Menurunkan arogansi intelektual kita itu sangat penting
  5. Pesan #3 Salah satu cara belajar yang terbaik adalah mengajar
  6. Penutup: Sukses dan Semoga berhasil!
Lulusan Data Fellowship Batch #6
Data Fellowship Batch #6 IYKRA – graduation

Semangat!

Kalideres, 26 November 2021

KUIS PYTHON (3/3)

208

Oleh: Bernardus Ari Kuncoro

Apabila ada perintah berikut,

a = 30
b = 20
c = 10
if (a + b) / c == 1 and c - b - a == 0:
    print('yes')
else:
    print('no')`

Apa yang akan menjadi keluaran dari perintah di atas?

  • A. yes
  • B. no

Coba cek jawaban Anda pakai compiler Python online, ya!

Soal ini diambil dari buku Lima Dasar Data Science untuk Pemula.

Kalideres, 7 November 2021

MELLY DAN MALIK (1/10)

Tantangan Menulis Hari ke-186

Oleh: Bernardus Ari Kuncoro

Melly, seorang gadis berkulit putih dan bermata belok. Berusia 18 tahun dan pernah memiliki prestasi akademis yang luar biasa. Waktu SD dia selalu rangking satu. Waktu SMP dia makin menggila lagi. Tetap rangking satu terus. Nilai UAN Matematika-nya sempurna, sepuluh. Namun, saat dia duduk di bangku SMA, dia mengalami penurunan prestasi. Ada momen-momen yang membuat dia burn out. Sampai-sampai dia tidak bisa masuk ke universitas negeri favorit yang diidam-idamkan. Dia harus puas dengan pilihan lainnya, di sebuah universitas swasta di kawasan Pasar Bunga Rawabelong Jakarta Barat. Dengan jurusan Teknik Informatika.

Malik, sosok pemuda berusia 19 tahun, rambut keriting, kulit sawo matang. Dia merupakan teman kuliah Melly. Mereka satu angkatan di semester tiga. Di jurusan inilah Malik menemukan cintanya. Bukan! Bukan cintanya kepada seorang wanita, ya gaeees. Melainkan kecintaannya terhadap salah satu mata kuliahnya, terutama Machine Learning.

Masa pandemi setahun setengah ini hanya membuat mereka bisa bersua lewat layar komputer. Tidak pernah tatap muka.

Hingga suatu ketika, mereka mendapatkan sebuah tugas dari seorang dosen Machine Learning yang super kreatif.

Anehnya, tugas ini baru mereka dapatkan jika mampu menyelesaikan Teka Teki Silang berikut. Link yang disiapkan sang dosen adalah bit.ly/xxxxxxxxxxx (bagian x banyak kali inilah yang mesti dicari lewat TTS ini)

Melly: “Gilak, ni dosen… Niat banget bikin sulit soal. Hidup gue aja udah susah. Bantuin dong Malik”

Tulis Melly kepada Malik di LINE chat nya.

Malik: “Gampang nih, Mel. Gue bisa! Gue bantuin asalkan … “

BERSAMBUNG

Kalideres, 16 Oktober 2021

Visualisasi Data #12: Square Area

Tantangan Menulis Hari ke-185

Square area adalah salah satu visual yang memanfaatkan luas area untuk memperlihatkan data yang dimiliki. Visual yang mirip dengan waffle ini sangat ampuh untuk menunjukkan nilai kuantitas dua atau lebih kategori yang berbeda. Contoh dari visual square area chart ini dapat diilustrasikan pada Gambar berikut

Contoh Visual Square Area yang menggambarkan Statistik Dunia (Erickson, 2019)

Sumber: 100people.org

Kalideres, 15 Oktober 2021

TAMAT.