Abstrak RSS

Dampak Imputasi Terhadap Error Klasifikasi Pada Analisis Diskriminan

Dampak Imputasi Terhadap Error Klasifikasi Pada Analisis Diskriminan
Bambang Ruswandi
Unpad
Indonesia
Unpad
, , ,

Suatu penelitian yang menggunakan metode survei sangat jarang sekali akan didapatkan data yang terbebas dari data hilang. Adanya data hilang akibat nonrespon akan menimbulkan data hasil survei menjadi tidak lengkap yang akan menyebabkan hilangnya informasi dan penaksiran parameter menjadi tidak efisien. Untuk mengatasi data hilang dapat dilakukan dengan menggunakan analisis statistika yaitu dengan menggunakan metode imputasi. Beberapa metode imputasi untuk mengatasi data hilang antara lain Metode Imputasi Regresi dan Metode Predictive Mean Matching (PMM) yang merupakan metode imputasi berganda. Pada penelitian ini kedua metode tersebut diuji melalui simulasi dan diterapkan pada data klasifikasi jantung kemudian hasilnya diperbandingkan. Penaksiran data hilang dengan metode imputasi PMM memberikan hasil penaksiran yang lebih beragam daripada metode imputasi regresi. Hal ini terlihat dimana secara umum nilai rata-rata koefisien varians dari metode imputasi PMM lebih besar daripada metode imputasi regresi. Pada analisis diskriminan, hasil penaksiran data hilang memberikan perubahan terhadap error klasifikasi jika dibandingkan dengan data lengkap sebenarnya. Penaksiran dengan metode imputasi PMM memberikan dampak menurunkan error klasifikasi lebih besar daripada metode imputasi regresi.

A research w using survey method is very rarely that the data would be obtained free of missing data. The missing data will lead to a result nonrespon survey data to be incomplete which will result in the loss of information and parameter estimation becomes inefficient. To overcome the missing data can be done using statistical analysis is by using the imputation method. Several methods of imputation to overcome missing data include Imputed Regression Methods and Predictive Mean Matching Method (PMM) which is a multiple imputation method. In this study, these methods are tested through simulations and applied to the data classification of the heart, then the results compared. Estimation of missing data imputation method PMM provides the results of the assessment is more diverse than regression imputation method. This can be seen where in general the average value of the coefficient of variance of the imputation method PMM greater than regression imputation method. In discriminant analysis, missing data estimation results provide the changes to the classification error when compared with actual complete data. Estimating PMM imputation method gives lower the impact of classification error is greater than regression imputation method.

Untuk Keterangan Lebih Lanjut Silahkan Menghubungi : http://cisral.unpad.ac.id