Sabtu, 29 Maret 2014

HAIR : Analisis Diskriminan dan Probit Logit

Hal 431-439
Pseudo R2 Measures
Pseudo pengukuran R2 berbasis reduksi dalam nilai -2LL. Ada tiga pengukuran dalam membandingkan R2 dalam regresi berganda :
  1. The Cox,
  2. Snell R2,
  3. Nagelkerke R2.

Nilai R2 dari dua variable menunjukkan pengembangan substantive diantara model variable tunggal yang mengindikasikan model fiit yang baik saat dibandingkan dengan nilai R2 yang biasanya ditemukan di regresi berganda.

Klasifikasi Akurasi
Pengujian dari model keseluruhan untuk memeriksa klasifikasi akurasi dan indikasi kebaikan model dalam pengukuran final dalam praktik signifikansi. Matriks klasifikasi, identik digunakan dalam analisis diskriminan, yang menunjukkan level akurasi prediktif yang dicapai dari model logistic. Nilai 65,5% dari kemungkinan criteria proporsional dan 76,3% untuk kemungkinan criteria maksimum.
  • Hit ratio keseluruhan untuk variable tunggal logistic masing-masing 73,7% dan 75% untuk analisis dan untuk sampel yang bertahan.
  • Ada dua model variable menunjukkan pengembangan yang besar dalam kedua hit ratio keseluruhan seperti yang dilakukan olehj group-specific values.
Diantara tiga pengukuran dasar untuk model keseluruhan, model dua variable menunjukkan dua level penerimaan ; statistik dan praktik signifikansi. Dengan diterimanya keseluruhan model fit, maka perhatian tertuju pada tes statistic untuk koefisien logistic dalam rangka mengidentifikasi koefisien yang memiliki hubungan signifikan yang berefek pada group membership.

Statistical Significance of The Coefficients
Estimasi koefisien dari dua variable independent dan konstan juga harus dievaluasi untuk signifikansi statistik. Wald statistic digunakan untuk menilai signifikansi dalam kesamaan penggunaak t test dalam regresi berganda. Tidak ada variable yang masuk dan diterima ke dalam model setidaknya dengan angka 0,05 level signifikansi.

Casewise Diagnostics
Casewise Diagnostics
 Seperti residual dan pengukuran pengaruh yang ada, seperti pada analisis profil tahapan awal discriminant analysis.

Stage 5 : Interpretation of teh Results
Stepwise prosedur regresi logistik menghasilkan variate yang sangat mirip dari dua grup analisis diskriminan.

Interpretasi Koefisien Logistik
Direction of The Relationship
Interpretasi dari hubungan langsung darri sinyal koefisien logistik sebenarnya.
Magnitude of The Relationship
Metode paling umum untuk memeriksa magnitude of change dalam probabilitas di tiap variable independent untuk menguji koefisen eksponen. Pendekatan lain dalam memahami bagaimana koefisien logistic menjelaskan probabilitas kemungkinan adalah dengan mengkalkulasi prediksi probabilitas di tiap susunan nilai dari variable independent.
Koefisien logistic menjelaskan hubungan positif antara dua variable dan mengembangkan arti untuk melihat dampak perubahan keduanya,  kejanggalan pada variable, dan memprediksi probabilitas.

Stage 6 : Validasi regresi logistic
Validasi regresi logistic model regresi adalah dicapainya contoh ini dengan metode yang sama dengan menggunakan analisis diskriminan, menciptakan analisan dan mempertahankan sampel. Dua variabel final untuk dua-variabel model regresi, hit ratio untuk kedua analisa, dan mempertahankan sampel melebihi standar proporsional dan maksimum.

Managerial Overview
Regresi Logistik menampilkan sebuah alternatif analisis diskriminan yang mungkin lebih mudah digunakan karena kemiripannya dengan regresi berganda. Adanya kekuatan dalam mengolah data, dapat berefek negatif pada analisis diskriminan. Dimana bila dibandingkan dengan diskriminan analisis, regresi logistik mengembangkan akurasi komparasi prediktif yang menyederhanakan variate yang menggunakan interpretasi substansif yang sama, hanya dengan satu variabel yang lebih sedikit.


-------------------------------------------------------------------------------------------------------
Ringkasan


Ø      Menyatakan keadaan dimana analisis diskriminan linear atau regresi logistik harus digunakan, bukan regresi berganda
Diskriminan analisis berganda dan regresi logistik adalah teknik statistik yang melibatkan variabel dependen singel kategorikal tunggal dan beberapa independen variabel metrik. Dalam banyak kasus, dependen variabel terdiri dari dua grup atau beberapa klasifikasi, contohnya laki-laki dan perempuan, tinggi lawan rendah, baik lawan buruk. Di kasus yang lain, dua atau lebih kasus dilibatkan diantaranya klasifikasi rendah, sedang dan tinggi. Analisis diskriminan dan regresi logistik mampu menangani dua atau lebih grup berganda. Hasil dari analisis diskriminan dan regresi logistik dapat membantu dalam menampilkan karakteristik intergrup dari subyek dan menetapkan mereka ke dalam grup yang tepat.
Ø      Mengidentifikasi isu penting terkait variabel yang digunakan dan ukuran sampel yang dibutuhkan dalam aplikasi analisis diskriminan
Variabel independen terbagi menjadi dua :
1.      Dengan mengidentifikasi variabel baik dari riset sebelumnya atau dari teori model yang merujuk pada pertanyaan riset
2.      Dengan memanfaatkan pengetahuan dan intuisiuntuk memilih variabel yang tidak memiliki riset sebelumnya, teori ini eksis namun secara logika mungkin bisa terhubung untuk memprediksi grup variabel dependen.
Sebuah rsion dari 20 observasi dari tiap prediktor variabel disarankan, karena hasil menjadi tidak stabil seiring dengan penurunan relatif pada junlah variabel independen. Ukuran minimum disarankan dalam lima obsarvasi per variabel independen.

Ø      Memahami asumsi analisis diskriminan dalam memeriksa ketepatan dalam model partikular.
Asumsi kunci untuk turunan fungsi diskriminan adalah normalitas multivariat dari variabel independen dan tidak diketahui (tetapi sama) dispersi dan struktur kovarians untuk grup itu seperti yang dijelaskan oleh variabel dependen. Apabila asumsi tersebut dilanggar, peneliti harus memahami dampak dari hasil yang diharapkan dan mempertimbangkan alternatif metode analisis lain.
Ø      Menjabarkan ketepatan dua hitungan untuk analisis diskriminan dan metode untuk mengamati kecocokan model secara keseluruhan.
Dua pendekatan untuk analisis diskriminan adalah metode langsung simultan dan stepwise method. Metode simultan melibatkan penghitungan fungsi diskriminan dengan mempertimbangkan semua variabel independen di waktu yang sama. Fungsi diskriminan dihitung berdasarkan seluruth susunan variabel independen.
Stepwise estimation merupakan alternatif dari pendekatan simultan, yang mengikuti sequential process dari penambahan atau pengurangan variabel analisis diskriminan. Peneliti harus mengevaluasi signifikansi statistik dari discriminatory power dari fungsi diskriminan. Apabila stepwise method digunakan untuk mengestimasi fungsi diskriminan, Malahanobis D2 dan pengukuran Rao’s V adalah metode yang paling cocok untuk mengamatinya.
Ø      Menjelaskan apa klasifikasi matriks itu dan bagaimana mengembangkannya, serta menjelaskan cara untuk mengevaluasi akurasi prediktif dari fungsi diskriminan
Fungsi diskriminan hanya untuk mengamati derajat perbedaan antara grup berbasis pada Z score diskriminan, tapi tidak mengindikasikan seberapa baik fungsi tersebut diprediksi.
Prosedrur matriks klasifikasi, mengembangkan persepektif dalam praktik signifikansi dibanding signifikansi statistik. , dan peneliti harus menjelaskan cutting score untuk tiap fungsi diskriminan. Entri-entri dalam matriks diagonal menunjukkan angka koreksi klasifikasi individual. Apabila ukuran grup telah sama, maka kemungkinan klasifikasi determinasi berbasis banyaknya grup. Saat ukuran grup tidak sama, penghitungan kemungkinan kesempatanbisa dikerjakan dengan dua cara : Maksimum dan proporsional. 
Ø      Menjelaskan bagaimana mengidentifikasi variabel independen dengan discriminant power
Apabila fungsi diskriminan signifikasn secara statistik, dan akurasi klasifikasi diterima, peneliti harus fokus pada pembuatan substantive interpretasi pada hasil penemuan. Tiga metode menjelaskan relative important yang telah ditemukan :
1.      Standardized discriminant weights
2.      Discriminant loadings (Structure correlations)
3.      Partial F values
Independen variabel secara relatif lebih besar berkontribusi dalam discriminant powerdalam fungsi daripada yang dilakukan variabel dengan berat kontribusi lain. Saat metode stepwise estimation digunakan, sebuah pengertian tambahan diinterpretasikan pada discriminant power oleh variabel independen dalam penggunaan F value parsial. Nilai F yang besar mengindikasikan discriminant power yang lebih besar.
Ø      Membenarkan penggunaan pendekatan split-sample untuk validasi
Validasi dapat terjadi baik dari sampel terpisah maupun dalam pengulangan pemanfaatan prosedur dalam proses estimasi sampel. Validasi hit ratio dilakukan biasanya dengan membuat sampel holdout. 
Ø      Memahami kekuaan dan kelemahan regresi logistik dibandingkan analisis diskriminan serta regresi berganda
Analisis diskriminan sangat tepat digunakan saat variabel dependen berskala nonmetrik. Apabila dependen variabel hanya terdiri dari dua grup, regresi logistik lebih tepat digunakan karena dua alasan :
1.      Analissi diskriminan bergantung pada ketatnya pertemuan asumsi normalitas multivariat dan persamaan varians dan kovarians matriks antargrup, dengan asumsi mereka tidak bertemu dalam banyak situasi.
2.      Meswkipun asumsi telah bertemu, banyak peneliti memilih logistik karena kemiripannya dengan regresi berganda
Ø      Interpretasi hasil dari analisis regresi logistik dengan membandingkan kedua nya : regresi berganda dan analisis diskriminan
The goodness-of-fit dari model regresi dapat diamati dengan dua cara :
1.      Menggunakan nilai pseudo R2, seperti yang ditemukan dalam regresi berganda
2.      Menguji akurasi prediktif seperti yang dilakukan dalam matriks klasifikasi di analisis diskriminan.
Diskriminan loadings dalam analisis diskriminan diinterpretasikan berbeda dengan koefisien logistik. Hubungan positif berarti adanya peningkatan pada varioabel independen yang diasosiasikan dengan peningkatan prediksi probablitas dan vice versa untuk hubungan negatif.


Analisis diskriminan berganda dan regresi logistik membantu kita untuk memahami dan menjelaskan problem penelitian yang m,elibatkan variabel dependen kategorikal tunggal dan beberapa independen variabel berskala metrik.

0 komentar:

Posting Komentar