Pondok Belajar: ALGORITMA K-MEANS

Pondok Belajar December 15, 2018 Data Mining Comment

Pembahasan Algoritma K-Means

Pengertian K-Means

K-Means merupakan salah satu algoritma dalam data mining yang bisa digunakan untuk melakukan pengelompokan/clustering suatu data. Menurut (Witten, dkk, 2012) dalam (Dhuhita, 2015) ada beberapa pendekatan dalam membuat cluster, salah satu pendekatan tersebut membuat aturan yang mendikte keanggotaan dalam group yang sama berdasarkan tingkat persamaan diantara anggota-anggotanya. Pendekatan lainnya adalah dengan membuat sekumpulan fungsi yang mengukur beberapa properti dari pengelompokan tersebut sebagai fungsi dari beberapa parameter dari sebuah clustering.

Selain itu, menurut (Khomarudin, 2016) K-means clustering merupakan salah satu metode cluster analysis non hirarki yang berusaha untuk mempartisi objek yang ada kedalam satu atau lebih cluster atau kelompok objek berdasarkan karakteristiknya, sehingga objek yang mempunyai karakteristik yang sama dikelompokan dalam satu cluster yang sama dan objek yang mempunyai karakteristik yang berbeda dikelompokan kedalam cluster yang lain.

2. Langkah-langkah Algoritma K-Means

Adapun langkah-langkah algoritma K-Means (Witten & Frank, 2005) antara lain sebagai berikut :

Pilih secara acak k buah data sebagai pusat cluster
Jarak antara data dan pusat cluster dihitung menggunakan Euclidian Distance. Untuk menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori jarak Euclidean yang dirumuskan sebagai berikut :

Keterangan :

d_ij = Jarak objek antara objek i dan j

P = Dimensi data

X_ik = Koordinat dari obyek i pada dimensi k

X_jk = Koordinat dari obyek j pada dimensi k
Data ditempatkan dalam cluster yang terdekat, dihitung dari tengah cluster
Pusat cluster baru akan ditentukan bila semua data telah ditetapkan dalam cluster terdekat
Proses penentuan pusat cluster dan penempatan data dalam cluster diulangi sampai nilai centroid tidak berubah lagi.
Keterangan :
- d_ij = Jarak objek antara objek i dan j
  
  P = Dimensi data
  
  X_ik = Koordinat dari obyek i pada dimensi k
  
  X_jk = Koordinat dari obyek j pada dimensi k
  
  Dhuhita, P. (2015). Clustering Menggunakan Metode K-Means untuk Menentukan Status Gizi Balita. Jurnal Informatika, 15(2), 160–174.
  
  Khomarudin, A. N. (2016). Teknik Data Mining : Algoritma K-Means Clustering. Retrieved November 22, 2018, from http://ilmukomputer.org/wp-content/uploads/2018/05/agus-k-means-clustering.pdf
  
  Witten, I., & Frank, E. (2005). Data Mining Practical Machine Learning Tools and Techniques. San Fransisco: Elsevier Inc.

Saturday, December 15, 2018

ALGORITMA K-MEANS

Popular Posts

Pondok Belajar

Search This Blog

Popular Posts

About Me

Categories

Sosial Media

Blog Archive

Translate