Langkah-langkah dalam melakukan analisis cluster


Langkah-langkah dalam melakukan analisis cluster

1 Analisis Cluster
Menurut Metisen (2015), Clustering merupakan teknik yang digunakan dalam mengelompokkan karakteristik atau kesamaan dalam hal tertentu. Cluster merupakan kumpulan data yang sama terhadap objek yang yang lain atau berbeda terhadap cluster. Objek yang terdapat pada suatu cluster akan mempunyai kemiripan yang tinggi antara yang satu dengan lainnya. Clustering berfungsi sebagai menemukan hubungan yang sama atau keterkaitan antara atribut data, serta dapat menentukan pola distribusi secara keseluruhan. Cluster juga dapat diartikan sebagai kumpulan data dalam suatu cluster atau lebih dan objeknya datanya harus mempunyai kemiripan dalam cluster tersebut. Ukuran data yang bisa digunakan untuk menentukan kemiripan atau kedekatan suatu data yaitu jarak.
Sehingga dapat disimpulkan bahwa analisis cluster merupakan analisis yang digunakan sebagai pengelompokan pada suatu pengamatan atau menggabungkan variabel menjadi beberapa kelompok yang jumlahnya akan berkurang atau sedikit. Analisis cluster dapat dilakukan jika pengamat belum mengetahui jumlah kelompok yang baru. Objek tersebut akan dipilih sesuai dengan karakteistiknya dan dikalsifikasikan ke dalam kelompok atau cluster sehingga satu cluster akan memiliki kemiripan atau karakteristik yang sama.
Menurut Yuliato (2014), Ciri-ciri cluster yang baik ada dua yaitu :
1.      Homogenitas (within-cluster) merupakan kesamaan dan kemiripan yang besar antar satu anggota dengan yang lainnya dalam satu cluster.
2.      Heterogenitas (between-cluster) merupakan perbedaan yang sangat besar antar anggota yang satu dengan cluster yang lain.


2 Langkah-Langkah Pengklasteran
Menurut Yuliato (2014), langkah-langkah pengklasteran ada lima macam yakni :
1.      Sampel yang diambil harus sudah mewakili suatu populasi yang ada.
2.      Pengujian Multikolinearitas, pengujian ini digunakan sebagai untuk mengetahui ada tidaknya variabel independen yang mempunyai karakterisktik atau kemiripan yang sama dengan variabel independen yang lain.
3.      Transformasi Data, pengujian ini dilakukan untuk mengetahui jika terdapat perbedaan nilai yang besar atau tinggi antar variabel yang satu dengan yang lain sehingga dapat mengakibatkan bias pada analisis cluster maka data aslinya membutuhkan transformasi data atau standarisasi data. Contohnya dengan melakukan penyamaan satuan terhadap data yang digunakan.
4.      Pengujian Data Outlier, data outlier merupakan data yang secara nyata berbeda dengan data-data yang lainnya atau disebut juga dengan nilai yang berbeda dalam suatu sampel. Untuk mengetahui nilai outlier dapat dilakukan dengan menentukan nilai batas yang akan dijadikan sebagai outlier yaitu dengan cara mengkonversi nilai data ke z-score atau biasa disebut dengan standardized. Outlier dapat dilakukan penganganan seperti data outlier dihilangkan, outlier disebabkan karenda adanya kesalahan databpada saat penginputan data. Outlier tetap dipertahankan jika tidak ada kesalahan pada proses sampling.
5.      Metode yang digunakan merupakan metode hirarki (average linkage).
Langkah pegelompokan pada analisis cluster pada metode hirarki :
1. Mengukur kesamaan ajarak
2. Membentuk klaster ssecara hirarki
3. Melakukan interpetasi terhadap jumlah klaster


0 Komentar untuk "Langkah-langkah dalam melakukan analisis cluster"

Back To Top