Langkah-langkah dalam melakukan analisis cluster
1 Analisis Cluster
Menurut Metisen (2015), Clustering merupakan teknik yang
digunakan dalam mengelompokkan karakteristik atau kesamaan dalam hal tertentu.
Cluster merupakan kumpulan data yang
sama terhadap objek yang yang lain atau berbeda terhadap cluster. Objek yang terdapat pada suatu cluster akan mempunyai kemiripan yang tinggi antara yang satu
dengan lainnya. Clustering berfungsi
sebagai menemukan hubungan yang sama atau keterkaitan antara atribut data,
serta dapat menentukan pola distribusi secara keseluruhan. Cluster juga dapat diartikan sebagai kumpulan data dalam suatu cluster atau lebih dan objeknya datanya
harus mempunyai kemiripan dalam cluster
tersebut. Ukuran data yang bisa digunakan untuk menentukan kemiripan atau
kedekatan suatu data yaitu jarak.
Sehingga dapat disimpulkan
bahwa analisis cluster merupakan
analisis yang digunakan sebagai pengelompokan pada suatu pengamatan atau
menggabungkan variabel menjadi beberapa kelompok yang jumlahnya akan berkurang
atau sedikit. Analisis cluster dapat
dilakukan jika pengamat belum mengetahui jumlah kelompok yang baru. Objek
tersebut akan dipilih sesuai dengan karakteistiknya dan dikalsifikasikan ke
dalam kelompok atau cluster sehingga
satu cluster akan memiliki kemiripan
atau karakteristik yang sama.
Menurut Yuliato (2014),
Ciri-ciri cluster yang baik ada dua
yaitu :
1.
Homogenitas (within-cluster)
merupakan kesamaan dan kemiripan yang besar antar satu anggota dengan yang
lainnya dalam satu cluster.
2.
Heterogenitas (between-cluster)
merupakan perbedaan yang sangat besar antar anggota yang satu dengan cluster yang lain.
2 Langkah-Langkah
Pengklasteran
Menurut
Yuliato (2014), langkah-langkah pengklasteran ada lima macam yakni :
1.
Sampel yang diambil harus sudah mewakili suatu populasi yang
ada.
2.
Pengujian Multikolinearitas, pengujian ini digunakan sebagai
untuk mengetahui ada tidaknya variabel independen yang mempunyai karakterisktik
atau kemiripan yang sama dengan variabel independen yang lain.
3.
Transformasi Data, pengujian ini dilakukan untuk mengetahui
jika terdapat perbedaan nilai yang besar atau tinggi antar variabel yang satu
dengan yang lain sehingga dapat mengakibatkan bias pada analisis cluster maka data aslinya membutuhkan
transformasi data atau standarisasi data. Contohnya dengan melakukan penyamaan
satuan terhadap data yang digunakan.
4.
Pengujian Data Outlier,
data outlier merupakan data yang secara nyata berbeda dengan data-data yang
lainnya atau disebut juga dengan nilai yang berbeda dalam suatu sampel. Untuk
mengetahui nilai outlier dapat
dilakukan dengan menentukan nilai batas yang akan dijadikan sebagai outlier
yaitu dengan cara mengkonversi nilai data ke z-score atau biasa disebut dengan standardized.
Outlier dapat dilakukan penganganan
seperti data outlier dihilangkan, outlier disebabkan karenda adanya kesalahan
databpada saat penginputan data. Outlier
tetap dipertahankan jika tidak ada kesalahan pada proses sampling.
5.
Metode yang digunakan merupakan metode hirarki (average linkage).
Langkah pegelompokan pada analisis cluster
pada metode hirarki :
1. Mengukur kesamaan ajarak
2. Membentuk klaster ssecara hirarki
3. Melakukan interpetasi terhadap jumlah klaster
0 Komentar untuk "Langkah-langkah dalam melakukan analisis cluster"