Saturday, December 15, 2018

ALGORITMA K-MEANS

Pembahasan Algoritma K-Means

  1. Pengertian K-Means
K-Means merupakan salah satu algoritma dalam data mining yang bisa digunakan untuk melakukan pengelompokan/clustering suatu data. Menurut (Witten, dkk, 2012) dalam (Dhuhita, 2015) ada beberapa pendekatan dalam membuat cluster, salah satu pendekatan tersebut membuat aturan yang mendikte keanggotaan dalam group yang sama berdasarkan tingkat persamaan diantara anggota-anggotanya. Pendekatan lainnya adalah dengan membuat sekumpulan fungsi yang mengukur beberapa properti dari pengelompokan tersebut sebagai fungsi dari beberapa parameter dari sebuah clustering.
Selain itu, menurut (Khomarudin, 2016) K-means clustering merupakan salah satu metode cluster analysis non hirarki yang berusaha untuk mempartisi objek yang ada kedalam satu atau lebih cluster atau kelompok objek berdasarkan karakteristiknya, sehingga objek yang mempunyai karakteristik yang sama dikelompokan dalam satu cluster yang sama dan objek yang mempunyai karakteristik yang berbeda dikelompokan kedalam cluster yang lain.  


2. Langkah-langkah Algoritma K-Means


Adapun langkah-langkah algoritma K-Means (Witten & Frank, 2005) antara lain sebagai berikut :
  • Pilih secara acak k buah data sebagai pusat cluster
  • Jarak antara data dan pusat cluster dihitung menggunakan Euclidian Distance. Untuk menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori jarak Euclidean yang dirumuskan sebagai berikut : 

  • Keterangan :
    dij = Jarak objek antara objek i dan j 
    P  = Dimensi data
    Xik  = Koordinat dari obyek i pada dimensi k
    Xjk  = Koordinat dari obyek j pada dimensi k
     
  • Data ditempatkan dalam cluster yang terdekat, dihitung dari tengah cluster
  • Pusat cluster baru akan ditentukan bila semua data telah ditetapkan dalam cluster terdekat 
  • Proses penentuan pusat cluster dan penempatan data dalam cluster diulangi sampai nilai centroid tidak berubah lagi. 

  • Keterangan :
    • dij = Jarak objek antara objek i dan j 
      P  = Dimensi data
      Xik  = Koordinat dari obyek i pada dimensi k
      Xjk  = Koordinat dari obyek j pada dimensi k
      Dhuhita, P. (2015). Clustering Menggunakan Metode K-Means untuk Menentukan Status Gizi Balita. Jurnal Informatika, 15(2), 160–174.
      Khomarudin, A. N. (2016). Teknik Data Mining : Algoritma K-Means Clustering. Retrieved November 22, 2018, from http://ilmukomputer.org/wp-content/uploads/2018/05/agus-k-means-clustering.pdf
      Witten, I., & Frank, E. (2005). Data Mining Practical Machine Learning Tools and Techniques. San Fransisco: Elsevier Inc.
       


EmoticonEmoticon

Popular Posts