APA ITU LABEL SPREADING?

251

Oleh: Bernardus Ari Kuncoro

Ini adalah copywriting concept untuk salah satu postingan di iykra_id. Saya mengangkat topik Label Spreading yang sempat saya tulis di postingan ini.

Slide 1

Anak data: “Gimana ya Min, aku mau bikin model klasifikasi, tapi banyak data nggak ada label-nya?”

Mimin: “Aha, bisa jadi kamu belum kenal sama metode yang satu ini, bro!”

Yuk, kenalan sama **Label Spreading! **

Sumber: https://machinelearningmastery.com/semi-supervised-learning-with-label-spreading/

Slide 2

Label Spreading merupakan salah satu contoh pendekatan semi-supervised learning untuk model prediksi klasifikasi.

Algoritme ini diperkenalkan oleh Dengyong Zhou, et al. pada sebuah paper tahun 2003
berjudul “Learning with Local and Global Consistency”.

Sumber: https://proceedings.neurips.cc/paper/2003/file/87682805257e619d49b8e0dfdc14affa-Paper.pdf

The key to semi-supervised learning problems is the prior assumption of consistency, which means: (1) nearby points are likely to have the same label; and (2) points on the same structure typically referred to as a cluster or a manifold) are likely to have the same label.

— Learning With Local And Global Consistency, 2003.

Slide 3

Gimana sih Label Spreading ini bekerja? Ada empat langkah besar.

  1. Tentukan hubungan antar datapoint. Kamu dapat menyebutnya Matriks W dengan rumus berikut.

https://miro.medium.com/max/1400/1*lYDgHEgsz7QUV79Z0DDfKQ.png

sehingga nanti akan ada matriks W, atau yang kamu bisa sebut sebagai matriks affinity berikut:

https://miro.medium.com/max/1400/1*qocL-rJYrCx9AzFQbGmhTw.png

  1. Buat matriks graph Laplacian yang akan membuat matriks W ternormalisasi secara simetris.

https://miro.medium.com/max/1400/1*UxSvk8fzLRjMaVjSobxLmA.png

  1. Gunakan matriks hasil kedua untuk menentukan matriks F yang berisi vektor label.

https://miro.medium.com/max/1400/1*EoipN-5dPDvgew_vMyaT3g.png

  1. Lakukan langkah 3 sampai terkonvergen atau mencapai iterasi maksimum. Sehingga label yang kosong bisa terisi.

Slide 4

Label Spreading ini ada di scikit-learn dengan LabelSpreading Class. Penggunaannya seperti apa?

Slide 5

Kenapa mesti repot-repot pakai semi-supervised learning?
Simply karena di dunia nyata, nggak semua data training berlabel itu tersedia. Label mesti di-generate. Bisa secara manual atau otomatis seperti ini.

Slide 6

Well, Ikuti terus postingan @iykra_id, ya!
Silakan like, komen, dan share ke teman-teman tersayang.
Biar Mimin makin semangat bikin konten.

Hasilnya jadi seperti ini:

Kalideres, 21 Desember 2021

DATA SCIENCE LEARNING PATH 2022

250

Oleh: Bernardus Ari Kuncoro

Tak bisa dipungkiri, Data Science jadi magnet skill berkekuatan besar. Selain karena lowongannya bertebaran di berbagai sektor, skill ini diperkirakan akan terus terpakai.

Buat Anda yang bukan dari background jurusan IT atau Statistik, nggak usah berkecil hati! Banyak kok Data Heroes IYKRA yang berlatarbelakang di luar jurusan tersebut.

Biar nggak bingung, ini dia

IYKRA’s recommendation for Junior Data Scientist’s Learning Path in 2022

Step 1 – Intro to Data Science (DS)

Step 2 – Data Viz (Tableau or Power BI)

Step 3 – Programming
Writing SQL
Python Programming for DS
UNIX Command

Step 4 – Statistics for DS

Step 5 – Exploratory Data Analysis

Step 6 –
Explainable Machine Learning (Supervised and Unsupervised Learning)
Model Deployment

Step 7 – Big Data Tools for DS

Step 8 – Business & Legal

The next step is performing Analytic Portfolio Project (APP) for Data Scientists with Real Clients!

Good Luck, Anak Data!

Well, ini konten saya buat copy-nya dan sudah dipercantik oleh tim Kreatif IYKRA dan sudah naik di sini.

Bagi Anda yang tertarik mendalami Data Science, silakan gabung di kelas online Data Science Foundation Udemy di sini.

Kalideres, 20 Desember 2021

APA ITU CRONTAB?

244

Oleh: Bernardus Ari Kuncoro

Crontab merupakan salah satu fitur dalam sistem operasi berbasis UNIX yang digunakan untuk menjadwalkan jalannya suatu script.

Jadi Anda bisa mengatur tugas secara terjadwal seperti download dataset, menjalankan model, upload data agregat, dan lain sebagainya.

File konfigurasi yang khusus menangani command agar berjalan secara periodik pada jangka waktu yang sudah ditentukan disebut crontab. File crontab disimpan di mana daftar tugas dan instruksi lainnya tersimpan.

Bagaimana cara menggunakan file crontab?

Lebih lanjut tentang crontab, Anda dapat mengunjungi tautan berikut:  https://crontab.guru/.

Kalideres, 14 Desember 2021

BAGAIMANA CARA BERLATIH SHELL SCRIPTING?

243

Oleh: Bernardus Ari Kuncoro

Menurut saya, berlatih Shell Scripting sebaiknya dilakukan di server. Untuk memiliki server Ubuntu, dapat dilakukan dengan subscribe cloud. Salah satunya adalah dengan Digital Ocean (lebih mudah untuk pemula).

Detail cara instalasi Bash di server dan environment Python, SQL dan Bash dapat dilihat pada tautan berikut ini:

https://bit.ly/InstallPySQLBashR

Jika Anda sudah selesai menyewa server, Anda bisa membuka server tersebut dengan Terminal. Hubungkan ssh misal ke sini:

ssh dataguy1@IPAddress.

Ada sepuluh perintah shell scripting yang populer, yang penulis rekomendasikan untuk dipraktikkan. Apa saja perintah-perintah tersebut?

    - ssh (connect to different server)
    - cd (change directory)
    - ls (list all dir or files under the dir)
    - mkdir (make directory)
    - mv (move or change file location)
    - rm (remove file)
    - scp (server copy)
    - cp (copy)
    - chmod (change mode of the file)
    - chown (change ownership of the file)

Kutipan ini ada di buku Lima Dasar Data Science yang bisa Anda beli di sini dan bisa dipelajari di Online Course Udemy Data Science Foundation.

Kalideres, 13 Desember 2021

APA ITU SHELL SCRIPTING?

242

Oleh: Bernardus Ari Kuncoro

Shell scripting merupakan bahasa pemrograman yang lebih terkenal dengan sebutan command line dan bukan merupakan bahasa yang ditujukan khusus untuk data science. Bahasa pemrograman ini dibuat untuk berinteraksi dengan sistem operasi UNIX. Anda dapat mengetikkan perintah dan Shell akan menginterpretasikannya.

Satu hal yang pasti, belajar shell scripting ini tidak hanya berguna untuk data science, tetapi Anda akan dapat menggunakannya lebih dari sekadar data science seperti penggunaannya dalam data engineering, automasi script, dan segala sesuatu yang berhubungan dengan sistem operasi server UNIX.

Kutipan ini ada di buku Lima Dasar Data Science yang bisa Anda beli di sini dan bisa dipelajari di Online Course Udemy Data Science Foundation.

Kalideres, 12 Desember 2021

JIKA ANDA BUTUH IDE

241

Oleh: Bernardus Ari Kuncoro

Kegiatan mencari ide sering kali terhambat. Saya tidak jarang menemukan problem ini. Merasa ide tidak ngalir. Lalu, kalau Anda menemukan masalah yang sama dengan saya, apa yang akan Anda lakukan?

Salah satu sahabat saya memberikan rekomendasi untuk membuka website https://answerthepublic.com/

Answerthepublic.com di browser Anda.

Di dalamnya Anda dapat mengetikkan kata kunci. Misal, data science. Lalu pilih negara dan bahasa. Saya pilih United States dan English. Lalu klik Search.

Hasilnya seperti ini.

Ada 79 kombinasi pertanyaan yang bisa didapatkan. Anda juga dapat mengunduhnya sebagai file csv. Ooops. Kalau melebihi tiga kali klik search dalam sehari, mesti nunggu esok hari. ‘Dijatah’, gaes, ternyata.

Kalideres, 11 Januari 2021

BERBICARA dengan SEPENUH Hati

238

Oleh: Bernardus Ari Kuncoro

Barusan saya mengikuti sebuah kelas daring yang bertajuk Voice Over Training. Di dalam kelas tersebut ada salah satu materinya adalah tentang bagaimana caranya berbicara dengan sepenuh hati.

Ada tiga tips, guys. Apa saja?

Kalian mesti bisa menjawab tiga pertanyaan ini.

  1. Who are you talking to?
  2. What are you saying?
  3. Why are you saying this?

Jika ketiga hal itu bisa kalian gunakan, maka pastinya cara bicara Anda akan lebih targeted. Lebih mengena. Dan bisa lebih mudah dilakukan.

Komunikasi jadi lebih menyenangkan.

Kalideres, 8 Desember 2021