Pembahasan Algoritma K-Means
- Pengertian K-Means
K-Means merupakan salah satu algoritma dalam data mining yang bisa digunakan untuk melakukan pengelompokan/clustering suatu data. Menurut (Witten, dkk, 2012) dalam (Dhuhita, 2015) ada beberapa pendekatan dalam membuat cluster, salah satu pendekatan tersebut membuat aturan yang mendikte keanggotaan dalam group yang sama berdasarkan tingkat persamaan diantara anggota-anggotanya. Pendekatan lainnya adalah dengan membuat sekumpulan fungsi yang mengukur beberapa properti dari pengelompokan tersebut sebagai fungsi dari beberapa parameter dari sebuah clustering.
Selain itu, menurut (Khomarudin, 2016) K-means clustering merupakan salah satu metode cluster analysis non hirarki yang berusaha untuk mempartisi objek yang ada kedalam satu atau lebih cluster atau kelompok objek berdasarkan karakteristiknya, sehingga objek yang mempunyai karakteristik yang sama dikelompokan dalam satu cluster yang sama dan objek yang mempunyai karakteristik yang berbeda dikelompokan kedalam cluster yang lain.
2. Langkah-langkah Algoritma K-Means
Adapun langkah-langkah algoritma K-Means (Witten & Frank, 2005) antara lain sebagai berikut :
- Pilih secara acak k buah data sebagai pusat cluster
- Jarak antara data dan pusat cluster dihitung menggunakan Euclidian Distance. Untuk menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori jarak Euclidean yang dirumuskan sebagai berikut :
-
Keterangan :dij = Jarak objek antara objek i dan jP = Dimensi dataXik = Koordinat dari obyek i pada dimensi kXjk = Koordinat dari obyek j pada dimensi k
- Data ditempatkan dalam cluster yang terdekat, dihitung dari tengah cluster
- Pusat cluster baru akan ditentukan bila semua data telah ditetapkan dalam cluster terdekat
- Proses penentuan pusat cluster dan penempatan data dalam cluster diulangi sampai nilai centroid tidak berubah lagi.
Keterangan :- dij = Jarak objek antara objek i dan jP = Dimensi dataXik = Koordinat dari obyek i pada dimensi kXjk = Koordinat dari obyek j pada dimensi kDhuhita, P. (2015). Clustering Menggunakan Metode K-Means untuk Menentukan Status Gizi Balita. Jurnal Informatika, 15(2), 160–174.Khomarudin, A. N. (2016). Teknik Data Mining : Algoritma K-Means Clustering. Retrieved November 22, 2018, from http://ilmukomputer.org/wp-content/uploads/2018/05/agus-k-means-clustering.pdfWitten, I., & Frank, E. (2005). Data Mining Practical Machine Learning Tools and Techniques. San Fransisco: Elsevier Inc.
EmoticonEmoticon