Skip to main content

Implementasi dan Perhitungan Manual Algoritma K-Means dalam Clustering Data

Haloo kaka kaka pejuang skripsi!

Spesial untuk kamu nih kak yang sedang menyusun skripsi, khususnya dengan judul yang diangkat berkaitan dengan Algoritma K-Means. Di sini kami tim pembimbing Dokterskripsi.com akan menjelaskan seluk beluk tentang Algoritma K-Means, mulai dari pengertian, tahap tahap clusternya, perhitungan manual dan contoh programnya. Semoga bisa membantu kamu ya kak!

Pengertian Algoritma K-Means

K-Means Clustering merupakan metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi.
Baca Juga: Manfaat Data Mining
Dalam beberapa teknik yang paling sederhana  dan umum dikenal adalah klastering k-means. Dalam teknik ini kita ingin mengelompokkan obyek kedalam k kelompok atau klaster. Untuk melakukan klastering ini, nilai k harus ditentukan terlebih dahulu. Biasannya user atau pemakai sudah mempunyai informasi awal tentang obyek yang sedang dipelajari, termasuk jumlah klaster yang paling tepat. Secara detail kita bisa menggunakan ukuran ketidak miripan untuk mengelompokkan obyek kita. Ketidak miripan bisa diterjemahkan dalam konsep jarak. Jika jarak dua obyek atau data titik cukup dekat, maka dua obyek itu mirip. Semakin dekat berarti semakin tinggi kemiripannya. Semakin tinggi nilai jarak, semakin tinggi ketidak miripannya.

Tahap Clustering Pada K-Means

  1. Menentukan k (nilainya bebas) sebagai jumlah cluster yang ingin dibentuk.
  2. Membangkitkan nilai random untuk pusat cluster awal (centroid) sebanyak k.
  3. Menghitung jarak setiap data input terhadap masing–masing centroid menggunakan rumus jarak Euclidean (Euclidean Distance) hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Berikut adalah persamaan Euclidian Distance:
  4. Mengklasifikasikan setiap data berdasarkan kedekatannya dengan centroid (jarak terkecil).
  5. Memperbaharui nilai Nilai centroid baru di peroleh dari rata-rata cluster yang bersangkutan dengan menggunakan rumus:
  6. Melakukan perulangan dari langkah 3 hingga 5, sampai anggota tiap cluster tidak ada yang berubah.

Contoh Kasus dan Perhitungan Manual Algoritma K-Means

Berikut contoh penerapan K-Means menggunakan contoh study kasus pada penjualan kartu telkomsel pada setiap kota. berikut ini Langkah penerapan metode clustering K-Means pada penjualan kartu telkomsel dibeberapa daerah.

Berikut contoh data yang sudah dikumpulkan dari beberapa kota.
Tabel Transformasi Data

NO  
 
Area
Jumlah Transaksi Jml Vol Data Rata-rata penjualan
1 Jakarta (kartuHALO) 1 29.489.127.424,00 29.489.127.424,00
2 Bogor (simPATI) 5 125.623.335.936,00 25.124.667.187,20
3 Banten (LOOP) 14 232.929.964.032,00 23.292.996.403,20
4 Bandung (KartuAS) 3 39.927.040.000,00 19.963.520.000,00
5 Depok (KartuAS) 16 227.271.073.792,00 18.939.256.149,33
6 Jogjakarta (LOOP) 27 398.242.689.024,00 17.314.899.522,78
7 Semarang (LOOP) 86 984.850.739.200,00 16.145.094.085,25
8 Surabaya (simPATI) 8 125.616.196.608,00 15.702.024.576,00
9 Bantul (simPATI) 14 207.552.093.184,00 14.825.149.513,14
10 Malang (simPATI) 7 93.172.805.632,00 13.310.400.804,57
11 Bali (KartuAS) 24 234.459.030.528,00 13.025.501.696,00
12 Bekasi (LOOP) 90 880.470.165.504,00 12.578.145.221,49
13 Jepara (LOOP) 26 242.963.350.528,00 12.148.167.526,40
14 Sukabumi (LOOP) 29 242.494.959.616,00 12.124.747.980,80

Pada tahap ini dilakukan data yang didapaykan sesuai dengan sistem yang akan digunakan dalam analisis data mining. Transformasi ini dilakukan dengan cara memasukkan data-data transaksi penjualan ke dalam aplikasi data mining.

  1. Menetapkan jumlah cluster. Jumlah cluster ditetapkan berdasarkan hasil transaksi penjualan yaitu C1, C2, dan C3. Oleh karena itu jumlah cluster yang ditetapkan adalah 3 cluster.
  2. Inisialisasi pusat cluster (centroid) secara acak berdasarkan data skor hasil survei lapangan. Nilai pusat cluster dapat dilihat pada table berikut:
    Tabel Inisialisasi Cluster

    C1 C2 C3
    1 8 2
    29.489.127.424,00 72.276.496.384,00 912.057.344,00
    29.489.127.424,00 10.325.213.769,14 456.028.672,00
  3. Hitung jarak setiap data terhadap pusat cluster. Misalnya untuk menghitung jarak instance pertama dengan pusat cluster pertama adalah:
    Berikut adalah hasil perhitungan lengkap dari perhitungan clustering:

    NO  
     
    Area
    Jumlah Transaksi Jml Usg Rvnue Rata-rata penjualan C1 C2
    1 Jakarta (kartuHALO) 1 29.489.127.424,00 29.489.127.424,00 0,00 46.882.987.629,74
    2 Bogor (simPATI) 5 125.623.335.936,00 25.124.667.187,20 96.233.230.016,39 55.361.621.288,22
    3 Banten (LOOP) 14 232.929.964.032,00 23.292.996.403,20 203.535.171.504,56 161.175.990.934,67
    4 Bandung (KartuAS) 3 39.927.040.000,00 19.963.520.000,00 14.131.072.703,10 33.754.766.705,46
    5 Depok (KartuAS) 16 227.271.073.792,00 18.939.256.149,33 198.063.116.437,73 155.233.761.637,13
    6 Jogjakarta (LOOP) 27 398.242.689.024,00 17.314.899.522,78 368.954.470.114,78 326.041.123.865,00
    7 Semarang (LOOP) 86 984.850.739.200,00 16.145.094.085,25 955.454.798.763,91 912.592.800.573,23
    8 Surabaya (simPATI) 8 125.616.196.608,00 15.702.024.576,00 97.110.749.326,98 53.610.015.057,25
    9 Bantul (simPATI) 14 207.552.093.184,00 14.825.149.513,14 178.665.755.038,33 135.350.421.171,48
    10 Malang (simPATI) 7 93.172.805.632,00 13.310.400.804,57 65.706.636.385,73 21.108.459.958,62
    11 Bali (KartuAS) 24 234.459.030.528,00 13.025.501.696,00 205.630.037.082,56 162.205.012.056,53
    12 Bekasi (LOOP) 90 880.470.165.504,00 12.578.145.221,49 851.149.051.865,05 808.196.809.264,78
    13 Jepara (LOOP) 26 242.963.350.528,00 12.148.167.526,40 214.177.386.341,38 170.696.588.536,43
    14 Sukabumi (LOOP) 29 242.494.959.616,00 12.124.747.980,80 213.712.438.152,89 170.227.975.222,77
  4. Mengklasifikasi setiap data berdasarkan kedekatannya dengan titik pusat data atau centroid diambil berdasarkan tingkat penjualan rendah, sedang, dan tinggi dari sampel data penjualan Telkomsel.
    NO  
     
    Area
    Jumlah Transaksi Jml Usg Rvnue Rata-rata penjualan C1 C2 Cluster
    1 Jakarta (kartuHALO) 1 29.489.127.424,00 29.489.127.424,00 0,00 46.882.987.629,74 C1
    2 Bogor (simPATI) 5 125.623.335.936,00 25.124.667.187,20 96.233.230.016,39 55.361.621.288,22 C2
    3 Banten (LOOP) 14 232.929.964.032,00 23.292.996.403,20 203.535.171.504,56 161.175.990.934,67 C2
    4 Bandung (KartuAS) 3 39.927.040.000,00 19.963.520.000,00 14.131.072.703,10 33.754.766.705,46 C1
    5 Depok (KartuAS) 16 227.271.073.792,00 18.939.256.149,33 198.063.116.437,73 155.233.761.637,13 C2
    6 Jogjakarta (LOOP) 27 398.242.689.024,00 17.314.899.522,78 368.954.470.114,78 326.041.123.865,00 C2
    7 Semarang (LOOP) 86 984.850.739.200,00 16.145.094.085,25 955.454.798.763,91 912.592.800.573,23 C2
    8 Surabaya (simPATI) 8 125.616.196.608,00 15.702.024.576,00 97.110.749.326,98 53.610.015.057,25 C2
    9 Bantul (simPATI) 14 207.552.093.184,00 14.825.149.513,14 178.665.755.038,33 135.350.421.171,48 C2
    10 Malang (simPATI) 7 93.172.805.632,00 13.310.400.804,57 65.706.636.385,73 21.108.459.958,62 C2
    11 Bali (KartuAS) 24 234.459.030.528,00 13.025.501.696,00 205.630.037.082,56 162.205.012.056,53 C2
    12 Bekasi (LOOP) 90 880.470.165.504,00 12.578.145.221,49 851.149.051.865,05 808.196.809.264,78 C2
    13 Jepara (LOOP) 26 242.963.350.528,00 12.148.167.526,40 214.177.386.341,38 170.696.588.536,43 C2
    14 Sukabumi (LOOP) 29 242.494.959.616,00 12.124.747.980,80 213.712.438.152,89 170.227.975.222,77 C2
  5. Memperbaharui nilai centroid. Sebagai contoh untuk cluster pertama (C1) terdapat 6 instance yaitu instance ke 1, 2, 6, 7, 8, dan 10 dengan catatan jika semua instance ditampilkan maka C1 akan memiliki jumlah instance( anggota cluster) yang Berikut contoh perhitungan untuk memperbaharui centroid dari 13 instance.
  6. Ulangi langkah 3 hingga 4,sampai anggota tiap cluster tidak ada yang berubah.

Contoh Program  Menggunakan Algoritma K-Means Berbasis Web


Berikut adalah tampilan program berbasis web menggunakan algoritma K-Means mengikuti perhitungan manual di atas, untuk memperbesar bisa klik gambar ya kak.

Materi ini dibuat oleh Tim Pembimbing Penulisan dan Programming Dokterskripsi.com. Semoga dapat membantu kamu yang sedang menyusun skripsi dengan Algoritma K-Means.
Jika kamu masih belum mengerti dan membutuhkan bantuan dalam proses pengerjaan skripsi, kamu bisa ikuti salah satu program bimbingan kami. Whatsapp: 0878 8885 1633, Email: [email protected] .
Terima Kasih.
 

Konsultasi Sekarang
Hmm, dilihat dari raut wajahnya sepertinya kaka lagi pusing masalah skripsi / tesis nih. Lagi bingung dimana kak? Belum punya judul? Stuck di proposal? Atau coding/ Algoritma? Klik di sini untuk mendapatkan bantuan dan konsultasi GRATIS.