Senin, 31 Maret 2014

TUGAS UAS KELOMPOK MULTIVARIATE DATA ANALYSIS : MULTIVARIATE ANALYSIS OF VARIANCE (MANOVA)

MULTIVARIATE ANALYSIS OF VARIANCE (MANOVA)

MANOVA merupakan multivariat perluasan dari konsep dan teknik univariate ANOVA yang digunakan untuk menganalisis perbedaan antara rata-rata (mean) kelompok. Perbedaan antara ANOVA dengan MANOVA yaitu ANOVA (Analysis of Variance) adalah bagian dari prosedur satistika yang digunakan untuk menganalisis perbedaan mean dari beberapa populasi dengan menggunakan data yang diperoleh yang diambil dari populasi yang diamati. Pengujian ANOVA hanya melibatkan satu variabel dependen metrik dengan variabel independen non metrik. Sedangkan MANOVA menguji dua atau lebih variabel dependen metrik dengan variabel independen non metrik.

ANOVA
                                                
                                                (metric)                        (Non Metric)

MANOVA
                                    
                                                (metric)                                    (Non Metric)

Pada kasus univariat, ukuran variabel dependen tunggal diuji untuk kesamaan diantara kelompok.  Di analisis MANOVA, peneliti sebenarnya mempunyai dua variate, satu untuk variabel dependen dan yang lain variabel independen. Variabel-variabel dependen lebih menarik karena ukuran dependen metrik dapat dikombinasikan pada satu kombinasi linier, seperti pada regresi berganda dan analisis diskriminan. Aspek unik dari MANOVA adalah variate secara optimal mengkombinasikan ukuran multiple dependen ke dalam nilai tunggal yang memaksimalkan perbedaan antar kelompok.



Prosedur Univariate
         t test
        Untuk menguji perbedaan antara dua kelompok
        t-statistik merupakan rasio dari perbedaan antara mean sampel (u1 – u2) terhadap standar errornya. Standar error merupakan estimasi perbedaan antara mean yang diharapkan karena kesalahan sampel, bukan perbedaan sesungguhnya antara mean.
        Jika nilai absolut t lebih besar dari nilai kritis t, maka kita dapat menolak Ho yang mengatakan tidak ada perbedaan. Hal ini berarti perbedaan aktual secara statistik lebih besar dari perbedaan yang diharapkan dari kesalahan sampel.
         Analysis of Variance (ANOVA)
        Untuk menguji perbedaan antara tiga kelompok atau lebih terhadap dua atau lebih variabel independen menggunakan uji F
        ANOVA digunakan untuk menentukan probabilitas bahwa perbedaan dalam mean antar beberapa kelompok adalah berdasarkan kesalahan sampe.
        Pengujian ANOVA secara langsung membandingkan dua estimasi independen dari variance  untuk variabel dependen. Yang pertama mewakili variabilitas umum dari responden dalam kelompok (MSW) dan yang lainnya mewakili perbedaan antar kelompok yang mempunyai pengaruh treatment (MSB).

Prosedur MANOVA
         Jika pada t test dan  ANOVA, pengujian hipotesis nol adalah kesamaan mean dari variable dependen antar kelompok. Pada MANOVA pengujian hipotesis nol adalah kesamaan mean dari vector multiple variable dependen antar kelompok
         The Two-Group Case:   Hotelling's T2 bentuk yang merupakan perluasan khusus dari univariate t test.Hotelling’s T2 menyediakan pengujian statistik  variabel yang dibentuk dari variabel dependen yang menghasilkan perbedaan kelompok terbesar. Hotelling’s T2 juga digunakan untuk masalah “inflating” jenis kesalahan I yang timbul ketika membuat serangkaian t test mean kelompok pada beberapa ukuran dependen. Hal ini mengendalikan inflasi dari jenis kesalahan I dengan menyediakan pengujian keseluruhan secara tunggal dari perbedaan kelompok diantara semua variabel dependen pada level a yang ditetapkan.
Hotelling’s T2
C = W1 Y+W2 Y2 + ...... + Wi Yi
Dimana :
C   =  komposit atau skor variate untuk responden
W i = bobot untuk variabel dependen i
Y i  = variabel dependen i      
Untuk bobot tertentu, kita harus menghitung skor komposit untuk setiap responden dan kemudian menghitung t statistik biasa untuk perbedaan antar kelompok atas skor komposit. Kita dapat menemukan serangkaian bobot yang memberi nilai maksimum untuk t statistik bagi data ini.
Bobot ini dapat sama dengan fungsi diskriminan antar dua kelompok. Nilai t  statistik maksimum yang dihasilkan dari skor komposit yang dihasilkan oleh fungsi diskriminan di kuadratkan untuk menghasilkan nilai Hotelling’s T2. Perhitungan formula Hotelling’s T2 mewakili hasil derivasi matematika yang digunakan untuk menyelesaikan t statistik maksimum (dan secara implisit diskriminasi kombinasi linear terhadap variabel dependen). Hal ini sama dengan jika kita dapat menemukan fungsi diskriminan untuk dua kelompok yang menghasilkan T2 yang signifikan, kedua kelompok dipertimbangkan berbeda diantara mean vektor.         
Nilai kritis bagi Hotelling’s T2           
                                      p(N1+N2-2)
                        T2crit = ----------------- x Fcrit
                                      N1+N2- p - 1

The k-Group Case:   MANOVA
Manova dapat dianggap sebagai perluasan dari prosedur Hotelling’s T2 dimana kita menemukan bobot variabel dependen untuk menghasilkan skor variate bagi setiap responden.
Dengan MANOVA kita akan mendapatkan seperangkat bobot yang memaksimumkan nilai F hitung ANOVA atas skor variate bagi seluruh kelompok. Namun MANOVA juga dianggap sebagai perluasan dari analisis diskriminan dengan multiple variate ukuran dependen yang dapat dibentuk jika jumlah kelompok tiga atau lebih. Variate yang pertama disebut fungsi diskriminan, menspesifikasi seperangkat bobot yang memaksimalkan perbedaan antar kelompok sehingga akan memaksimumkan nilai.
         Nilai maksimum F sendiri memungkinkan kita untuk menghitung secara langsung apa yang disebut Roy’s greatest characteristic root (gcr) statistik yang memungkinkan untuk pengujian statistik atas fungsi diskriminan pertama. Roy’s greatest characteristic root (gcr) statistik dapat dihitung sebagai :
Roy’s gcr = ( k – 1 ) Fmax / ( N – k ).
         Untuk mendapatkan pengujian tunggal terhadap hipotesis dari perbedaan yang tidak ada antar kelompok pada vektor pertama dari skor mean, kita dapat mengacu pada tabel distribusi gcr. Sama halnya dengan statistik F mengikuti distribusi yang diketahui atas hipotesis nol dari kesamaan mean kelompok atas variabel dependen tunggal, gcr statistik mengikuti distribusi yang diketahui atas hipotesis nol dari kesamaan mean vector kelompok (mean kelompok sama dengan seperangkat ukuran dependen). Perbandingan gcr yang diobservasi dan gcrcrit memberi kita dasar untuk menolak seluruh hipotesis nol dari kesamaan mean vektor kelompok.
         Fungsi diskriminan selanjutnya adalah orthogonal, yang memaksimalkan perbedaan antar kelompok berdasarkan varians sisa yang tidak dijelaskan oleh fungsi sebelumnya. Dengan demikian dalam beberapa hal pengujian untuk perbedaan antar kelompok melibatkan tidak hanya skor variate pertama tetapi juga seperangkat skor variate yang dievaluasi secara simultan. Sejumlah pengujian multivariate (Wilks’ lambda, Pillai’s criterion) yang masing-masingnya tepat untuk situasi terhadap pengujian multiple variate.

Hubungan Antara Prosedur Univariate Dan Multivarate

MANOVA dan Discriminant Analysis
         MANOVA dan Discriminant Analysis merupakan suatu hubungan seperti gambar dalam cermin dimana variabel dependen dalam MANOVA (variabel metrik) merupakan independen variabel dalam Discriminant Analysis dan variabel dependen nonmetrik tunggal dalam Discriminant Analysis menjadi variabel independen dalam MANOVA. Lebih lagi keduanya menggunakan metode yang sama dalam membentuk variate dan menguji signifikansi statistik antar kelompok.
         Perbedaan intinya adalah pada tujuan analisis dan peran dari variabel nonmetrik. Discriminant Analysis menggunakan variabel nonmetrik tunggal sebagai variabel dependen. Kategori variabel dependen diasumsikan given dan variabel independen digunakan untuk membentuk variate yang memaksimalkan perbedaan antar kelompok yang dibentuk oleh variabel dependen kategori. Pada MANOVA seperangkat variabel metrik bertindak sebagai variabel dependen dan tujuan untuk menemukan kelompok reponden yang menampilkan perbedaan pada perangkat variabel dependen.
         Kelompok responden tidak dispesifikasikan sebelumnya, peneliti menggunakan satu atau lebih variabel independen non metrik untuk membentuk kelompok. MANOVA selain dapat membentuk kelompok tersebut tetap memiliki kemampuan untuk menganalisis pengaruh setiap variabel non metrik secara terpisah.

Kapan seharusnya menggunakan MANOVA?
         Karena kemampuannya untuk menganalisis beberapa pengukuran dependen secara simultan, MANOVA memiliki keunggulan:
        Menyediakan Kontrol tingkat kesalahan eksperimen ketika terjadi beberapa derajat inter-korelasi diantara variabel dependen.
        Menyediakan statistik yang lebih kuat dari ANOVA ketika jumlah variabel dependen 5 atau kurang.




Tahapan dalam MANOVA :

Tahap 1:  Tujuan MANOVA
        Untuk menganalisis hubungan dependensi yang diwakili sebagai perbedaan dalam seperangkat ukuran dependen lintas seri kelompok yang dibentuk oleh satu atau lebih ukuran independent kategorial.
        Untuk menyediakan pengertian yang mendalam mengenai sifat dan kekuatan sifat prediksi dari ukuran independen seperti juga keterkaitan dan perbedaan dalam ukuran multiple dependen.

Terdapat 3 kategori permasalahan klasifikasi multivariate dilihat dari aspek penerapn MANOVA, yaitu :
         Multiple Univariate Questions.
Peneliti yang mempelajari pertanyaan-pertanyaan multiple univariate mengidentifikasi sejumlah variabel dependen secara terpisah yang akan dianalisis secara terpisah tetapi memerlukan beberapa kontrol terhadap kesalahan eksperimen. Dalam kejadian ini, MANOVA digunakan untuk menguji apakah perbedaan menyeluruh ditemukan di antara kelompok, dan kemudian pengujian univariate yang terpisah dilakukan untuk mendapatkan setiap isu untuk masing-masing variabel dependen.
         Structured Multivariate Questions.
Peneliti berurusan dengan pertanyaan multivariat terstruktur yang dikumpukan dari dua atau lebih ukuran dependen yang saling memiliki hubungan khusus. Situasi yang umum dalam kategori ini adalah ukuran yang berulang dimana ada multiple respon dari setiap subyek yang mungkin selama atau setelah pre test-post test memberikan stimulus, mislanya seperti iklan. Disini MANOVA menyediakan metode terstruktur untuk menspesifikasi perbandingan perbedaan antar kelompok terhadap seperangkat ukuran dependen dalam menjaga efisiensi secara statistik.
         Intrinsically Multivariate Questions.
Pertanyaan ini meliputi sejumlah ukuran dependen dimana mempertimbangkan prinsip bagaimana mereka berbeda sebagai keseluruhan lintas kelompok. Perbedaan ukuran dependen secara individual kurang menarik dibandingkan pengaruh kolektif. Keunggulan MANOVA tidak hanya dapat menguji perbedaan keseluruhan tetapi juga perbedaan antara kombinasi dari ukuran dependen yang tidak dapat muncul. Jenis pertanyaan ini bisa diselesaikan oleh MANOVA karena kemampuannya mendeteksi perbedaan multivariate walaupun pengujian univariate tunggal tidak menunjukkan perbedaan.

Tahap 2:  Disain Riset MANOVA
-       Membutuhkan ukuran sampel yang lebih besar dibandingkan univariate ANOVA dan harus melebihi batasan khusus pada setiap sel (kelompok). Analisis yang direkomendasikan adalah minimal ukuran sel 20 observasi. Sampel pada setiap sel harus lebih besar dari jumlah variabel dependen.
-       Desain Faktorial  – Analisis dengan dua treatment atau lebih.
Pemilihan Treatments, penggunaan yang umum dari disain faktorial meliputi pertanyaan riset yang berhubungan dengan dua atau lebih variabel independen nonmetrik terhadap seperangkat variabel dependen. Dalam masalah ini variabel independen dispesifikasikan dalam desain eksperimen atau termasuk dalam desain eksperimen lapangan atau survey menggunakan kuesioner. Namun dalam beberapa hal treatment ditambahkan setelah desain analisis.
Treatment tambahan yang sering digunakan adalah blocking factor dimana karakteristik nonmetrik digunakan post hoc untuk segmentasi responden untuk mendapatkan homogenitas kelompok yang lebih besar dan mengurangi sumber varians MSW. Dengan demikian kemampuan uji statistik untuk mengidentifikasi perbedaan dapat ditingkatkan. Sebagai contoh misalnya pada iklan, sebelumnya laki-laki dianggap akan mempunyai reaksi yang berbeda dengan perempuan terhadap tampilan iklan dan jika gender ditambahkan sebagai blocking factor, perbedaan setiap pesan menjadi lebih jelas, sedangkan perbedaan akan menjadi samar jika laki-laki dan perempuan di asumsikan akan bereaksi dengan berbeda dan tidak terpisah. Pengaruh jenis pesan dan gender kemudian di evaluasi secara terpisah, menyediakan pengujian yang lebih tepat terhadap pengaruh individual.

Menggunakan covariate-ANCOVA dan MANCOVA
         ANCOVA
Covariate metrik umumnya dimasukkan dalam desain eksperimental untuk menghilangkan pengaruh extraneous dari variabel dependen sehingga dapat meningkatkan varian dalam kelompok (MSW). Hal ini sama dengan mengunakan blocking factor hanya saja variabelnya metrik. Prosedurnya sama dengan regresi linier yang digunakan untuk menghilangkan variasi dalam variabel dependen yang berhubungan dengan satu atau lebih covariate, kemudian ANOVA konvensional dilakukan pada variabel dependen yang disesuaikan.
         MANCOVA
Merupakan perluasan dari prinsip ANCOVA untuk multivariate analisis (variabel dependen berganda) yaitu MANCOVA dipandang sebagai MANOVA terhadap regresi residual atau varian dalam variabel dependen yang tidak dapat dijelaskan oleh covariate

Tujuan dari Covariance Analysis
         Untuk mengeliminasi pengaruh:
        Yang hanya mempengaruhi sebagian responden  atau
        Yang bervariasi antar responden
         Sama halnya dalam menggunakan blocking factor, covariates dapat mencapai dua tujuan khusus yaitu:
        Mengeliminasi beberapa sistematis error diluar kontrol dari peneliti yang dapat membuat hasilnya menjadi bias, dan
        Mengakomodasi perbedaan respon terkait karakteristik unik dari responden.

Tahap 3:  Asumsi ANOVA dan MANOVA
         Untuk prosedur pengujian multivariat menggunakan MANOVA menjadi valid, maka harus memenuhi 3 asumsi yaitu :
1.      Observasi harus independen
2.      Matriks varians-kovarians harus sama (atau dapat diperbandingkan) untuk setiap kelompok treatment.
3.      Variabel dependen harus memiliki distribusi normal multivariat.
         Normalitas multivariat dapat diasumsikan tetapi sulit dalam pengujian. Normalitas univariat tidak menjamin normalitas multivariat, namun jika seluruh variabel memenuhi normalitas univariat maka kemencengan dari normalitas multivariat tidak konsekuensial. Kriteria lainnya adalah Linearitas dan multikollinearitas diantara variabel dependen serta sensitivitas terhadap outliers.

Tahap 4:  Estimasi Model MANOVA dan Menguji Overall Fit
         Saat analisis MANOVA telah diformulasikan dan uji asumsi telah terpenuhi, pengujian terhadap signifikansi perbedaan antar kelompok yang dibentuk dengan treatment dapat dilakukan. Dalam melakukan pengujian ini peneliti harus memilih pengujian statistik yang tepat untuk tujuan penelitiannya. Namun dalam situasi tertentu khususnya jika analisis menjadi lebih kompleks, peneliti harus mengevaluasi kekuatan dari pengujian statistik untuk menyediakan perspektif yang lebih informatif dan memperoleh hasil yang diharapkan.
         Empat pengukuran yang banyak digunakan untuk menguji signifikansi secara statistik antar kelompok terhadap variabel independen adalah:
        Roy’s Greatest Characteristic Root
        Wilk’s Lambda
        Pillai’s Criterion
        Hotelling’s Trace
         Dalam beberapa situasi hasil/kesimpulan bisa sama antar keempat pengukuran, namun dalam situasi yang unik, hasil dapat berbeda diantara keempat pengukuran.

Tahap 5:  Interpretasi Hasil MANOVA
         Jika covariate termasuk dalam model GLM, maka lakukan analisis model baik dengan maupun tanpa covariates. Jika covariates tidak meningkatkan kekuatan statistik atau tidak mempengaruhi secara signifikan terhadap pengaruh treatment, maka dapat didrop dari analisis final.
         Jika dua atau lebih variabel independen (treatments) termasuk dalam analisis, interaksi harus diuji sebelum mengambil kesimpulan mengenai pengaruh utama dari variabel independen :
a.       Jika interaksi tidak signifikan secara statistik, maka pengaruh utama dapat diinterpretasi langsung karena perbedaan antar treatments dipertimbangkan konstan antar level kombinasi.
b.      Jika interaksi signifikan secara statistik, dan perbedaan tidak konstan antar level kombinasi, maka interaksi harus ditentukan apakah ordinal atau disordinal:
         Jika variabel independen memiliki dua atau lebih kelompok, dua jenis prosedur dapat digunakan untuk mengisolasi sumber perbedaan yaitu :
a.       Post Hoc Methods
Post-hoc tests, menguji perbedaan potensial secara statistik antar seluruh mean kombinasi yang mungkin.  Post-hoc tests memiliki kekuatan yang terbatas dan sangat cocok untuk mengidentifikasi pengaruh yang besar. Post Hoc Methods meliputi :
         Scheffe
         Tukey’s honestly significant difference (HSD)
         Tukey’s extension of the Fisher least significant difference  (LSD)
         Duncan’s multiple-range test
         Newman-Kuels test
b.      A Priori or  Planned comparisons
Adalah prosedur yang tepat digunakan jika a priori theoretical reasons menyatakan bahwa kelompok tertentu akan berbeda dari satu kelompok dengan kelompok lainnya.  Kesalahan Type I akan bertambah sebagaimana jumlah planned comparisons meningkat.

Tahap 6:  Validasi terhadap Hasil
-          Teknik analisis varian (ANOVA dan MANOVA) dikembangkan untuk situasi eksperimen, dengan replikasi sebagai pengertian utama terhadap validasi. Ketegasan perlakuan treatment eksperimen  memungkinkan penggunaan yang luas dari eksperimen yang sama pada multiple populasi untuk menguji generalizability dari hasil.
-          Dalam penelitian ilmu pengetahuan sosial dan bisnis, bagaimanapun, eksperimen kerap kali digantikan dengan uji statistik dengan keadaan nonexperimental seperti survey penelitian. Kemampuan untuk memvalidasi hasil dalam keadaan ini adalah berdasarkan kemampuan replikasi dari treatment.

Sabtu, 29 Maret 2014

HAIR : Analisis Diskriminan dan Probit Logit

Hal 431-439
Pseudo R2 Measures
Pseudo pengukuran R2 berbasis reduksi dalam nilai -2LL. Ada tiga pengukuran dalam membandingkan R2 dalam regresi berganda :
  1. The Cox,
  2. Snell R2,
  3. Nagelkerke R2.

Nilai R2 dari dua variable menunjukkan pengembangan substantive diantara model variable tunggal yang mengindikasikan model fiit yang baik saat dibandingkan dengan nilai R2 yang biasanya ditemukan di regresi berganda.

Klasifikasi Akurasi
Pengujian dari model keseluruhan untuk memeriksa klasifikasi akurasi dan indikasi kebaikan model dalam pengukuran final dalam praktik signifikansi. Matriks klasifikasi, identik digunakan dalam analisis diskriminan, yang menunjukkan level akurasi prediktif yang dicapai dari model logistic. Nilai 65,5% dari kemungkinan criteria proporsional dan 76,3% untuk kemungkinan criteria maksimum.
  • Hit ratio keseluruhan untuk variable tunggal logistic masing-masing 73,7% dan 75% untuk analisis dan untuk sampel yang bertahan.
  • Ada dua model variable menunjukkan pengembangan yang besar dalam kedua hit ratio keseluruhan seperti yang dilakukan olehj group-specific values.
Diantara tiga pengukuran dasar untuk model keseluruhan, model dua variable menunjukkan dua level penerimaan ; statistik dan praktik signifikansi. Dengan diterimanya keseluruhan model fit, maka perhatian tertuju pada tes statistic untuk koefisien logistic dalam rangka mengidentifikasi koefisien yang memiliki hubungan signifikan yang berefek pada group membership.

Statistical Significance of The Coefficients
Estimasi koefisien dari dua variable independent dan konstan juga harus dievaluasi untuk signifikansi statistik. Wald statistic digunakan untuk menilai signifikansi dalam kesamaan penggunaak t test dalam regresi berganda. Tidak ada variable yang masuk dan diterima ke dalam model setidaknya dengan angka 0,05 level signifikansi.

Casewise Diagnostics
Casewise Diagnostics
 Seperti residual dan pengukuran pengaruh yang ada, seperti pada analisis profil tahapan awal discriminant analysis.

Stage 5 : Interpretation of teh Results
Stepwise prosedur regresi logistik menghasilkan variate yang sangat mirip dari dua grup analisis diskriminan.

Interpretasi Koefisien Logistik
Direction of The Relationship
Interpretasi dari hubungan langsung darri sinyal koefisien logistik sebenarnya.
Magnitude of The Relationship
Metode paling umum untuk memeriksa magnitude of change dalam probabilitas di tiap variable independent untuk menguji koefisen eksponen. Pendekatan lain dalam memahami bagaimana koefisien logistic menjelaskan probabilitas kemungkinan adalah dengan mengkalkulasi prediksi probabilitas di tiap susunan nilai dari variable independent.
Koefisien logistic menjelaskan hubungan positif antara dua variable dan mengembangkan arti untuk melihat dampak perubahan keduanya,  kejanggalan pada variable, dan memprediksi probabilitas.

Stage 6 : Validasi regresi logistic
Validasi regresi logistic model regresi adalah dicapainya contoh ini dengan metode yang sama dengan menggunakan analisis diskriminan, menciptakan analisan dan mempertahankan sampel. Dua variabel final untuk dua-variabel model regresi, hit ratio untuk kedua analisa, dan mempertahankan sampel melebihi standar proporsional dan maksimum.

Managerial Overview
Regresi Logistik menampilkan sebuah alternatif analisis diskriminan yang mungkin lebih mudah digunakan karena kemiripannya dengan regresi berganda. Adanya kekuatan dalam mengolah data, dapat berefek negatif pada analisis diskriminan. Dimana bila dibandingkan dengan diskriminan analisis, regresi logistik mengembangkan akurasi komparasi prediktif yang menyederhanakan variate yang menggunakan interpretasi substansif yang sama, hanya dengan satu variabel yang lebih sedikit.


-------------------------------------------------------------------------------------------------------
Ringkasan


Ø      Menyatakan keadaan dimana analisis diskriminan linear atau regresi logistik harus digunakan, bukan regresi berganda
Diskriminan analisis berganda dan regresi logistik adalah teknik statistik yang melibatkan variabel dependen singel kategorikal tunggal dan beberapa independen variabel metrik. Dalam banyak kasus, dependen variabel terdiri dari dua grup atau beberapa klasifikasi, contohnya laki-laki dan perempuan, tinggi lawan rendah, baik lawan buruk. Di kasus yang lain, dua atau lebih kasus dilibatkan diantaranya klasifikasi rendah, sedang dan tinggi. Analisis diskriminan dan regresi logistik mampu menangani dua atau lebih grup berganda. Hasil dari analisis diskriminan dan regresi logistik dapat membantu dalam menampilkan karakteristik intergrup dari subyek dan menetapkan mereka ke dalam grup yang tepat.
Ø      Mengidentifikasi isu penting terkait variabel yang digunakan dan ukuran sampel yang dibutuhkan dalam aplikasi analisis diskriminan
Variabel independen terbagi menjadi dua :
1.      Dengan mengidentifikasi variabel baik dari riset sebelumnya atau dari teori model yang merujuk pada pertanyaan riset
2.      Dengan memanfaatkan pengetahuan dan intuisiuntuk memilih variabel yang tidak memiliki riset sebelumnya, teori ini eksis namun secara logika mungkin bisa terhubung untuk memprediksi grup variabel dependen.
Sebuah rsion dari 20 observasi dari tiap prediktor variabel disarankan, karena hasil menjadi tidak stabil seiring dengan penurunan relatif pada junlah variabel independen. Ukuran minimum disarankan dalam lima obsarvasi per variabel independen.

Ø      Memahami asumsi analisis diskriminan dalam memeriksa ketepatan dalam model partikular.
Asumsi kunci untuk turunan fungsi diskriminan adalah normalitas multivariat dari variabel independen dan tidak diketahui (tetapi sama) dispersi dan struktur kovarians untuk grup itu seperti yang dijelaskan oleh variabel dependen. Apabila asumsi tersebut dilanggar, peneliti harus memahami dampak dari hasil yang diharapkan dan mempertimbangkan alternatif metode analisis lain.
Ø      Menjabarkan ketepatan dua hitungan untuk analisis diskriminan dan metode untuk mengamati kecocokan model secara keseluruhan.
Dua pendekatan untuk analisis diskriminan adalah metode langsung simultan dan stepwise method. Metode simultan melibatkan penghitungan fungsi diskriminan dengan mempertimbangkan semua variabel independen di waktu yang sama. Fungsi diskriminan dihitung berdasarkan seluruth susunan variabel independen.
Stepwise estimation merupakan alternatif dari pendekatan simultan, yang mengikuti sequential process dari penambahan atau pengurangan variabel analisis diskriminan. Peneliti harus mengevaluasi signifikansi statistik dari discriminatory power dari fungsi diskriminan. Apabila stepwise method digunakan untuk mengestimasi fungsi diskriminan, Malahanobis D2 dan pengukuran Rao’s V adalah metode yang paling cocok untuk mengamatinya.
Ø      Menjelaskan apa klasifikasi matriks itu dan bagaimana mengembangkannya, serta menjelaskan cara untuk mengevaluasi akurasi prediktif dari fungsi diskriminan
Fungsi diskriminan hanya untuk mengamati derajat perbedaan antara grup berbasis pada Z score diskriminan, tapi tidak mengindikasikan seberapa baik fungsi tersebut diprediksi.
Prosedrur matriks klasifikasi, mengembangkan persepektif dalam praktik signifikansi dibanding signifikansi statistik. , dan peneliti harus menjelaskan cutting score untuk tiap fungsi diskriminan. Entri-entri dalam matriks diagonal menunjukkan angka koreksi klasifikasi individual. Apabila ukuran grup telah sama, maka kemungkinan klasifikasi determinasi berbasis banyaknya grup. Saat ukuran grup tidak sama, penghitungan kemungkinan kesempatanbisa dikerjakan dengan dua cara : Maksimum dan proporsional. 
Ø      Menjelaskan bagaimana mengidentifikasi variabel independen dengan discriminant power
Apabila fungsi diskriminan signifikasn secara statistik, dan akurasi klasifikasi diterima, peneliti harus fokus pada pembuatan substantive interpretasi pada hasil penemuan. Tiga metode menjelaskan relative important yang telah ditemukan :
1.      Standardized discriminant weights
2.      Discriminant loadings (Structure correlations)
3.      Partial F values
Independen variabel secara relatif lebih besar berkontribusi dalam discriminant powerdalam fungsi daripada yang dilakukan variabel dengan berat kontribusi lain. Saat metode stepwise estimation digunakan, sebuah pengertian tambahan diinterpretasikan pada discriminant power oleh variabel independen dalam penggunaan F value parsial. Nilai F yang besar mengindikasikan discriminant power yang lebih besar.
Ø      Membenarkan penggunaan pendekatan split-sample untuk validasi
Validasi dapat terjadi baik dari sampel terpisah maupun dalam pengulangan pemanfaatan prosedur dalam proses estimasi sampel. Validasi hit ratio dilakukan biasanya dengan membuat sampel holdout. 
Ø      Memahami kekuaan dan kelemahan regresi logistik dibandingkan analisis diskriminan serta regresi berganda
Analisis diskriminan sangat tepat digunakan saat variabel dependen berskala nonmetrik. Apabila dependen variabel hanya terdiri dari dua grup, regresi logistik lebih tepat digunakan karena dua alasan :
1.      Analissi diskriminan bergantung pada ketatnya pertemuan asumsi normalitas multivariat dan persamaan varians dan kovarians matriks antargrup, dengan asumsi mereka tidak bertemu dalam banyak situasi.
2.      Meswkipun asumsi telah bertemu, banyak peneliti memilih logistik karena kemiripannya dengan regresi berganda
Ø      Interpretasi hasil dari analisis regresi logistik dengan membandingkan kedua nya : regresi berganda dan analisis diskriminan
The goodness-of-fit dari model regresi dapat diamati dengan dua cara :
1.      Menggunakan nilai pseudo R2, seperti yang ditemukan dalam regresi berganda
2.      Menguji akurasi prediktif seperti yang dilakukan dalam matriks klasifikasi di analisis diskriminan.
Diskriminan loadings dalam analisis diskriminan diinterpretasikan berbeda dengan koefisien logistik. Hubungan positif berarti adanya peningkatan pada varioabel independen yang diasosiasikan dengan peningkatan prediksi probablitas dan vice versa untuk hubungan negatif.


Analisis diskriminan berganda dan regresi logistik membantu kita untuk memahami dan menjelaskan problem penelitian yang m,elibatkan variabel dependen kategorikal tunggal dan beberapa independen variabel berskala metrik.

Jumat, 28 Maret 2014

HAIR : Memilih Antara Metode Data Reduksi

Memilih Antara Metode Data Reduksi
Apabila original variable digantikan oleh variable pengganti, factor scores, atau summated scales, keputusan harus dibuat manakah yang akan digunakan. Keputusan ini berdasarkan kebutuhan untuk menyederhanakan versus replikasi dalam studi lain versus keinginan untuk mengukur secara orthogonal.

Common Factor Analysis : Stage 4 dan 5
Perbedaan antara component analysis dan common factor analysis terjadi saat estimasi factor dan interpretasi stage. Sekali saja komunalitas digantikan pada diagonal, maka common factor model mengekstrak faktor dalam cara yang mirip pada component analysis.

Stage 4 : Deriving Factors dan Mengamati Kecocokan Keseluruhan
Reduksi matriks korelasi dengan komunalitas pada diagonal digunakan dalam common factor analysis. Langkah pertama untuk menentukan banyaknya factor yang bertahan dalam pengujian dan kemungkinan rotasi. Bila kita mendapatkan criteria root latent dengan nilai cutoff 1,0 dari eigenvalue, empat factor akan bertahan. Bagaimanapun, scree analysis mengindikasikan lima faktor yang harus dipertahankan.  Dalam kombinasi dua kriteria, mempertahankan empat faktor untuk analisis yang lebih jauh karena rendahnya nilai eigenvalue untuk faktor kelima dan untuk menjaga komparabilitas dengan analisis komponen. Pastikan bahwa ini adalah susunan keadaan yang sama yang ditemukan Dallam component analysis.
Yang perlu diingat bahwa di common factor analysis , hanya common atau shared variance yang digunakan. Jumlah dari eigenvalue, dan eigenvalue secara keseluruhan dari semua factor akan lebih rendah saat common factor yang dipertimbangkan.

Stage 5 : Interpretasi Faktor
Dengan menguji loading yang tidak dirotasi, kita harus membutuhkan rotasi factor matriks yang kita temukan ni component analysis. Factor loadings secara umum tidak setinggi yang diharapkan dan dua variable menampilkan cross-loadings. Dilanjutkan ke VARIMAX-ritated common factor analysis factor matrix.
Perbedaan utama dari banyak beda anata common factor dan component factor adalah secara umum loading yang lebih rendah ada pada common factor analysis karena komunalitas variabel yang lebih rendah digunakan dalam common factor analysis.

Managerial Overview of The Result
Pertama dengan memperhatikan struktur variabel, dalam hal ini memisahkan empat dan dimensi pembeda dari evaluasi yang digunakan konsumen dalam HBAT.


Summary

Ø      Membedakan teknik faktor analisis dari teknik multivariate lain
Saat variabel terkorelasi, dibutuhkan cara untuk mengelola variable-variabel ini :
Mengelompokkan variable-variabel dengan korelasi tinggi bersama-sama, melabeli ata atau menamai grup, dan bahkan mengkreasi pengukuran komposisi baru yang dapat merepresentasikan tiap grup variabel.
Ø      Membedakan antara exploratory dan confirmatory dalam penggunaannya dalam teknik factor analysis
Mendiskusikan teknik exploratory karena periset memiliki control kecil diantara spesifikasi struktur.
Ø      Memahami tujuh stage dari penerapan faktor analisis
1.      Klarifikasi obektif faktor analisis
2.      Mendesain faktor analisis termasuk seleksi variabel dan ukuran sampel
3.      Asumsi faktor analisis
4.      Deriving factors dan memeriksa kecocokan model secara keseluruhan
5.      Rotasi dan interpretasi faktor
6.      validasi solusi faktor analisis
7.      Tambahan penggunaan hasil faktor analisis seperti surrogate variabel, membuat summated scale atau menghitung fsactor score.
Ø      Membedakan R dan Q analisis faktor
Prinsip penggunaan analisis faktor untuk mengembangkan struktur diantara variabel disebut R faktor analisis. Faktor analisis juga dapat digunakan dalam kasus grup dan disebut Q factor analisis.
Ø      Mengidentifikasi perbedaan antara model component anaysis dan common factor analysis
Tiga tipe varians yang dipertimbangkan saat menerapkan faktor analisis: common variance, unique variance, dan error variance.
Component analysis atau principal component analysis dianggap sebagai total varians dan derived factor yang mengandung proporsi kecil dari varians yang unik dan terkadang error variance.
Component analysis dipilih saat data reduction adalah tujua utama. Common factor analisis berbasis hanya pada common variance dan asumsi unik dan error variance tidak tertarik dalam mendefinisikan struktur variable.
Ø      Menjelaskan bagaimana menentukan banyaknya faktor yang harus diekstrak
Saat memutuskan menghentinkan factoring, periset harus menggabungkan ponasi konseptual dengan beberapa landasan evidence. Kriteria ini kemudian digabungkan dengan pengukuran empiris struktur faktor.
Ø      Menjabarkan konsep faktor rotasi
Istilah rotasi berarti merujuk pada axes factor yang dirotasi dari titik originnya dengan beberapa posisi lain yang telah dicapai. Dua tipe rotasi adalah orthogonal dan oblique.
Rotasi faktor dalam interpretasi faktor dengan menyederhanakan struktur hingga memaksimalkan dignifikan loadings dari variabel pada single factor.
Ø      Menjelaskan bagaimana menamai faktor
Factor merepresentasikan sebuah komposite dari banyak variabel.
Variabel dengan loading tertingfgi dianggap lebih penting dan memiliki pengaruh yang lebih tinggi pada nama dan label yang diseleksi untuk merepresentasikan faktor.
Peneliti mengidentifikasi variabel dengan kontribusi terbesar dari faktor dan memasukkan nama untuk merepresentasikan pemahaman faktor konseptual.
Ø      Menjelaskan penggunaan tambahan dari analisis faktor
Apabila obyetif sederhana mengidentifikasi logika kombinasi dari variabel dan lebih baik memahami interrelationship diantara variabel kemudian faktor interpretasi akan mencukupi.
Pengukuran tunggal ini adalah kompisis variabel yang merefeksikan kontribusi relatif dari semua variabel pada faktor. Apabila summated scales valid dan reliable, dimungkinkan tiu merupakan yang terbaik dari tiga tipe alternatif data reduksi.
Ø      Menyatakan batasan utama teknik faktor analisis
Tiga dari most frequently citd limitations :
1.      Karena banyak teknik untuk performa exploratory analisis faktor tersedia, kontroversi yang ada diantara teknik ini adalah yang terbaik.
2.      Aspek subyektif dari faktor analisis adalah semua subyek untuk berbagia opini yang berbeda,
3.      Problem reliabilitas ini adalah riil.

Seperti prosedur statistic lain, analisis faktor dimulai dengan sebuah susunan data yang tidak sempurna. Faktor analisis jauh lebih komleks dan terlibat dengan subyek yang mungkin terindikasi. Problem ini menjadi kritis karena hasil dari frekuensi single factor analytic solution terlihat masuk akal. Sangat penting menekankan logika yang masuk akal tanpa garansi dari validitas dan reliabilitas.