ANALISIS REGRESI GANDA
MODEL
Regresi linear ganda adalah persamaan regresi yang menggambarkan hubungan antara lebih dari satu variabel bebas (x) dan satu variabel tidak bebas (y).
Persamaannya adalah
Regresi linear ganda untuk dua variabel bebas
Persamaannya adalah:
Dimana = Variabel terikat, = Variabel bebas, (regresi konstan) = intersep atau perpotongan dengan sumbu tegak , dan = parameter model regresi dan = kesalahan variabel bebas. Sebagai contoh data untuk menjelaskan proses perhitungan sebagai berikut:
y
3 2 1
2 3 5
4 5 3
5 7 6
8 8 7
Nilai dari koefisien , dan dapat ditentukan dengan cara:
Metode kuadrat terkecil
Sebagai contoh data untuk menjelaskan proses perhitungan sebagai berikut:
3 2 1
2 3 5
4 5 3
5 7 6
8 8 7
Sehingga persamaan regresi linier bergandanya adalah
Menggunakan Matriks
kita mengambil model setiap subjek skor y sebagai fungsi linear dari
Rangkaian persamaan dapat dinyatakan sebagai persamaan matriks tunggal:
X
itu sangat jelas bahwa skor y dan e mendefinisikan vektor kolom, sedangkan tidak begitu jelas adalah bagaimana kotak di bidang dapat direpresentasikan sebagai produk dari dua matriks
kolom pertama dari matrik digunakan untuk memperoleh regresi konstan. sisanya dua kolom berisi nilai untuk subjek pada dua prediktor. Sehingga persamaan matriks untuk regresi berganda adalah:
y = Xβ + e
sekarang, dapat ditunjukkan dengan menggunakan kalkulus bahwa kuadrat terkecil perkiraan β diberikan oleh:
sehingga data keluar koefisien regresi yang ditaksir akan menjadi:
Y
Langkah pertama :
dan
Langkah selanjutnya, menunjukkan bahwa:
dimana 1016 adalah determinan dari X’X. sehingga perkiraan koefisien regresi diberikan oleh:
oleh karena itu, persamaan regresi (variabel bebas) adalah
untuk menggambarkan penggunaan persamaan ini, kita menemukan nilai prediksi untuk 3 subjek dan sisa untuk subjek:
= .5 + 5 – .25(3) = 4.75
= = 4 – 4.75 = – .75
Matematis Maksimalisasi Sifat Dasar Kuadrat Terkecil Regresi
Secara umum kemudian, dalam regresi linier berganda kombinasi linier dari x maksimal dikorelasikan dengan y yang dicari. Meminimalkan jumlah kesalahan kuadrat dari prediksi setara dengan memaksimalkan hubungan antara pengamatan dan prediksi skor y. korelasi Pearson yang dimaksimumkan Ini disebut korelasi berganda, ditunjukkan sebagai R = . Nunnally (1978) menandaia prosedur sebagai daya prediksi yang terakhir (diperoleh dari kombinasi linier dari x's dari persamaan regresi.). Karena hubungan yang maksimum untuk sampel asal, ketika persamaan regresi diterapkan untuk sampel independent dari populasi yang sama (misalnya, cross-divalidasi), diprediksikan power tidak ada. Jika prediksi power kuat, maka kegunaan persamaan terbatas. Artinya, ia tidak digeneralisasikan, dan karenanya adalah nilai ilmiah yang terbatas. Bagaimanapun, kita peroleh persamaan prediksi untuk tujuan memprediksi sampel (lainnya) . Jika persamaan tidak memprediksi baik pada sampel lainnya, maka tidak memenuhi tujuan yang telah dirancang.
Ukuran sampel (n) dan jumlah prediktor (k) adalah dua faktor penting yang menentukan seberapa baik suatu persamaan yang diberikan akan cross-validasi (mis. generalisasi). Secara khusus, n / k rasio sangat penting. Untuk rasio yang kecil (5:1 atau kurang) penyusutan daya prediksi sangat besar. Sebuah studi oleh Guttman (1941) menggambarkan poin ini. Dia telah melakukan penelitian136 subyek dan 84 prediktor. dan menemukan korelasi berganda pada sampel asli sebanyak 73. Namun, ketika persamaan prediksi diterapkan pada sampel independen korelasi yang baru hanya 0,04! Dengan kata lain, daya prediksi yang baik pada sampel asli disebabkan oleh kapitalisasi pada peluang, dan persamaan prediksi itu tidak generalisasi.
Uraian Jumlah Kuadrat dalam Regresi dan Uji F untuk Korelasi Berganda
Dalam analisis varians kegagalan variabilitas terhadap mean besar di antara dan di dalam keragaman. dalam analisis regresi variabilitas dari mean dipecah menjadi variabilitas disebabkan oleh regresi dan variabilitas regresi. Untuk mendapatkan rinciannya, kita mulai dengan identitas sebagai berikut:
sekarang kita kuadrat kedua belah pihak, mendapatkan:
=
maka kita jumlahkan subjek di atas, dari 1 sampai n:
dengan menggunakan manipulasi aljabar, dapat ditulis sebagai:
Jumlah kuadrat Jumlah kuadrat Jumlah kuadrat
rata-rata = regresi + regresi yang seharusnya
( (
Df: n – 1 = (n – k – 1) + k(df = degres of freedom)
Hasil dalam analisis berikut tabel varians dan uji F untuk menentukan apakah beberapa korelasi populasi berbeda dari 0.
Tabel ANAVA untuk regresi
Source SS df MS F
Regresi k
Residual n – k – 1 n – k – 1)
(error)
ingat bahwa karena sisa untuk setiap subyek = , istilah kesalahan mean square dapat ditulis sebagai = . Sekarang (korelasi berganda kuadrat) diberikan oleh
demikian, mengukur proporsi total varians y yang dicatat dengan seperangkat prediktor. oleh aljabar sederhana maka kita dapat menulis ulang uji F dalam jangka waktu sebagai berikut:
F = 3.9 dengan df 10 dan 39
kami merasa tes ini adalah kegunaan batas, karena tidak perlu berarti bahwa persamaan akan melakukan validasi silang dengan baik, dan ini adalah isu penting dalam analisis regresi.
Pendugaan Dan Pengujian Koefisien Regresi
1. Kesalahan Baku Regresi dan Koefesien Regresi Ganda
Kesalahan baku atau selisih taksir standar regresi adalah nilai yang menyatakan seberapa jauh menyimpangnya nilai regresi tersebut terhadap nilai sebenarnya (nilai observasi). Nilai ini digunakan untuk mengukur tingkat ketepatan suatu penduga dalam menduga suatu nilai. Jika nilai ini sama dengan 0 (nol), maka penduga tersebut memiliki tingkat ketepatan 100%.
Kesalahan baku atau selisih taksir standar regresi ganda, dirumuskan :
Keterangan :
Se = Kesalahan baku regresi ganda
n = Jumlah pasangan observasi
m = Jumlah konstanta dalam persamaan regresi ganda
Untuk koefisien regresi ganda b1 dan b2, kesalahan bakunya dirumuskan :
Keterangan :
dan = kesalahan baku koefisien regresi ganda dan
= koefisien korelasi antara X1 dan X2
=
Atau untuk secara umumnya, dengan menggunakan matrix dapat menggunakan rumus:
Rumus diatas jauh lebih sederhana dan dapat digunakan untuk persamaan regresi yang koefisien b nya lebih dari 2. Contoh penghitungan dengan menggunakan matrix dapat dilihat pada file excel.
2. Pendugaan Interval Koefisien Regresi Ganda (Parameter dan )
Parameter dan sering juga disebut sebagai koefisien regresi parsial. Pendugaan parameter dan menggunakan distribusi t dengan derajat bebas (df) = n-k-1.
Secara umum, pendugaan parameter dan adalah
3. Pengujian Hipotesis Koefisien Regresi Ganda (Parameter dan )
Pengujian hipotesis bagi koefisien regresi ganda atau regresi parsial parameter dan dapat dibedakan menjadi dua bentuk, yaitu pengujian hipotesis serentak dan pengujian hipotesis individual.
a. Pengujian hipotesis serentak (uji F)
Pengujian hipotesis serentak merupakan pengujian hipotesis koefisien regresi ganda dengan B1 dan B2 serentak atau bersama-sama mempengaruhi Y. langkah-langkah pengujiannya ialah sebagai berikut:
1) Menentukan formulasi hipotesis
H0 : (X1 dan X2 tidak mempengaruhi Y)
H1 : (minimal salah satu tidak sama dengan 0), (X1 dan X2 mempengaruhi Y atau paling sedikit ada X yang mempengaruhi Y)
2) Menentukan taraf nyata (α) dan nilai F tabel
Taraf nyata (α) dan nilai F tabel ditentukan dengan derajat bebas v1 = k dan
v2 = n-k-1
v2 = n-k-1
3) Menentukan kriteria pengujian
H0 diterima apabila
H0 ditolak apabila
4) Menentukan nilai uji statistik dengan tabel ANOVA
Tabel ANOVA
Source
|
SS
|
df
|
MS
|
F0
|
Regresi
Residual
(error)
|
SSreg
SSres
|
k
n-k-1
|
SSreg/k
SSres/(n-k-1)
| |
Total
|
SS
|
n – 1
|
5) Membuat kesimpulan
Menyimpulkan apakah H0 diterima atau ditolak
Contoh soal:
Dengan menggunakan data Tabel, ujilah bahwa X1 dan X2 tidak mempengaruhi Y, dengan alternatif paling tidak satu yang mempengaruhi Y! Gunakan taraf nyata 1%!
Penyelesaian:
1. Formulasi hipotesisnya:
H0 : B1 = B2 = 0
H1 : B1 ≠ 0 atau B2 ≠ 0
2. Taraf nyata (α) dan nilai F tabelnya:
α = 1% = 0,01
v1 = 2 dan v2 = 10 - 2 - 1 = 7
3. Kriteria pengujiannya:
H0 diterima apabila
H0 ditolak apabila
4. Nilai uji statistik (F0) dengan tabel ANOVA
Sumber Variasi
|
SS
|
df
|
MS
|
F0
|
Regresi
|
962,176
|
2
|
481,088
| |
(X1, X2)
|
273,19
| |||
Error
|
12,324
|
7
|
1,761
| |
Total
|
974,5
|
9
|
5. Kesimpulan:
Karena , maka H0 ditolak. Jadi, ada pengaruh dari X1 dan X2 terhadap Y.
Cara penghitungan dengan metode matrix
Formulasi hipotesisnya:
H0 : B1 = B2 = 0
H1 : B1 ≠ 0 atau B2 ≠ 0
Taraf nyata (α) dan nilai F tabelnya:
α = 1% = 0,01
v1 = 2 dan v2 = 10 - 2 - 1 = 7
Kriteria pengujiannya:
H0 diterima apabila
H0 ditolak apabila
Penghitungan:
Maka
Sehingga persamaan Regresinya
Kesimpulan
Karena , maka H0 ditolak. Jadi, ada pengaruh dari X1 dan X2 terhadap Y.
b. Pengujian hipotesis individual
Pengujian hipotesis individual merupakan pengujian hipotesis koefisien regresi ganda dengan hanya satu B (B1 atau B2) yang mempengaruhi Y. langkah-langkah pengujiannya ialah sebagai berikut:
1) Menentukan formulasi hipotesis
H0 : Bi = 0 (tidak ada pengaruh Xi terhadap Y)
H1 : Bi > 0 (ada pengaruh positif Xi terhadap Y)
Bi < 0 (ada pengaruh negatif Xi terhadap Y)
Bi ≠ 0 (ada pengaruh Xi terhadap Y)
2) Menentukan taraf nyata (α) dengan t tabel
Taraf nyata dari t tabel ditentukan dengan derajat bebas (db) = n – k.
3) Menentukan kriteria pengujian
Kriteria pengujian yang ditentukan sama dengan kriteria pengujian dari pengujian hipotesis yang menggunakan distribusi t.
4) Menentukan nilai uji statistik
5) Membuat kesimpulan
Menyimpulkan apakah H0 diterima atau ditolak
Contoh soal:
Dengan menggunakan data Tabel, ujilah pendapat yang mengatakan sebagai berikut.
a. Tidak ada pengaruh nilai uji terhadap output pekerja, dengan alternatif ada pengaruh negatif. Pergunakan taraf nyata 5%!
b. Tidak ada pengaruh pengalaman kerja terhadap output pekerja, dengan alternatif ada pengaruh positif. Pergunakan taraf nyata 5%!
Penyelesaian:
a. Pengujian hipotesis B1
1) Formulasi hipotesisnya:
H0 : B1 = 0 (tidak ada pengaruh negatif)
H1 : B1 < 0 (ada pengaruh negatif)
2) Taraf nyata (α) dengan nilai t tabelnya:
α = 5% = 0,05 dengan df = 10 – 2 – 1 = 7
(uji sisi kiri)
3) Kriteria pengujiannya:
H0 diterima apabila t0 ≥ - 1,895
H0 ditolak apabila t0 < - 1,895
4) Nilai uji statistik (t0):
5) Kesimpulan:
Karena , maka H0 diterima. Jadi, tidak ada pengaruh negatif nilai uji terhadap output pekerja.
b. Pengujian hipotesis B2
1) Formulasi hipotesisnya:
H0 : B2 = 0 (tidak ada pengaruh positif)
H1 : B2 > 0 (ada pengaruh positif)
2) Taraf nyata (α) dengan nilai t tabelnya:
α = 5% = 0,05 dengan db = 7
(uji sisi kanan)
3) Kriteria pengujiannya:
H0 diterima apabila t0 ≤ 1,895
H1 ditolak apabila t0> 1,895
4) Nilai uji statistik (t0):
5) Kesimpulan:
Karena , maka H0 ditolak. Jadi, ada pengaruh positif pengalaman kerja terhadap output.
Cara penghitungan dengan metode matrix
Maka
Sehingga persamaan Regresinya
Maka
Pengujian hipotesis B1
1) Formulasi hipotesisnya:
H0 : B1 = 0 (tidak ada pengaruh positif)
H1 : B1 > 0 (ada pengaruh positif)
2) Taraf nyata (α) dengan nilai t tabelnya:
α = 5% = 0,05 dengan df = 10 – 2 – 1 = 7
3) Kriteria pengujiannya:
H0 diterima apabila t0 ≤ 1,895
H0 ditolak apabila t0 > 1,895
4) Nilai uji statistik (thitung):
5) Kesimpulan:
Karena , maka H0 ditolak. Jadi, tidak ada pengaruh positif nilai uji terhadap output pekerja.
Pengujian hipotesis B1
1) Formulasi hipotesisnya:
H0 : B2 = 0 (tidak ada pengaruh positif)
H1 : B2 > 0 (ada pengaruh positif)
2) Taraf nyata (α) dengan nilai t tabelnya:
α = 5% = 0,05 dengan df = 10 – 2 – 1 = 7
3) Kriteria pengujiannya:
H0 diterima apabila t0 ≤ 1,895
H0 ditolak apabila t0 > 1,895
4) Nilai uji statistik (thitung):
5) Kesimpulan:
Karena , maka H0 ditolak. Jadi, tidak ada pengaruh positif nilai uji terhadap output pekerja.
Analisis Regresi Ganda dengan Microsoft Excel 2007
Berikut langkah-langkah menganalisis Regresi Ganda dengan menggunakan Microsoft Excel 2007:
1. Buka Microsoft Excel
2. Jika data analysis belum tersedia pada tab data, maka lakukan instalasi dengan cara berikut:
a. Klik Microsoft Office Button, kemudian klik Excel Options
b. Klik Add-Ins, kemudian pada Manage box, pilih Excel Add-ins. Klik Go
c. Pada box Add-Ins available, pilih AnalysisnToolPack, beri conteng kemudian klik OK
3. Jika instalasi data analysis telah selesai, input data pada cells excel.
4. Blok data kemudian pada tab data klik data analysis, pilih regretion
5. Pada input Y range, input cells Y pada data. Dan pada input X range, input cells dan pada data. Pada output range klik cells yang kosong pada sheet. Beri tanda conteng pada Residual. Kemudian klik OK.
6. Tampilan akhir adalah seperti berikut
Analisis Regresi Ganda dengan Program SPSS 17.0
Selain menggunakan Microsoft office excel, analisis regresi ganda juga dapat diselesaikan dengan menggunakan program SPSS. Berikut langkah menyelesaikan analisis regresi ganda dengan menggunakan program tersebut:
1. Jalankan program SPSS 17.0
2. Entri data ke dalam programSPSS kemudian simpan dalam bentuk file misalnya dengan nama Data.
3. Analisis regresi dengan program SPSS dengan prosedur: klik Analyze, pilih Regression, klik Linear
4. Masukkan Y ke dalam kotak Dependent, kemudian X1 dan X2 ke dalam kotak Independen(s). pilih enter pada method.
5. Pada kotak Statistics, pada menu Regression Coefficients , pilih kotak Estimates, Model Fit, pada Residuel klik Durbin Watson (untuk menunjukkan hasil uji asumsi autokorelasi). Lalu klik Continue.
6. Pada kotak menu Options (Stepping Methode Criteria), kotak menu Include Constant in Equation adalah fasilitas bila ingin menampilkan konstanta persamaan garis regresi, biarkan dalam keadaann di checklist. Kotak menu Missing Values adalah menu untuk mengatasi adanya data hilang atau kosong serta data yang tidak tersedia dengan beberapa alternative pilihan pemecahannya, klik pada Exclude Cases Listwise, klik Continue
7. Klik OK dan tunggu beberapa saat akan keluar output nya
Out dan Interpretasi Regresi Ganda
Table di atas adalah table statistic deskriptif yang menyaikan besarnya nilai rata-rata (mean), standar deviasi dan N masing-masing variable.
Table di atas merupakan mattiks korelasi variable Y, X1, dan X2. Besarnya N masing-masing variable adalah 10 dan teknik analisis yang digunakan yaitu Pearson Correlation, dari output di atas dapat dibuat interpretasi korelasi yaitu:
1. Bila besarnya nilai probabilitas atau sig. (1-tiled) lebih kecil dari 0,05 maka H0 ditolak. Ini berarti adal korelasi yang signifikan.
2. Bila koefisien kerelasi bertanda positif, menunjukkan arah korelasinya positif (searah), mengandung pengertian semakin tinggi skor variabel pertama maka semakin tinggi pula skor variabel kedua, sebaliknya semakin rendah skor variabel pertama maka skor variabel kedua semakin rendah.
3. Bila koefisien korelasi bertanda negatif. Menunjukkan arah korelasinya negatif (berlawanan arah), mengandung pengertian semakin tinggi skor variabel pertama maka semakin rendah pula skor variabel kedua, sebaliknya semakin rendah skor variabel pertama maka skor variabel kedua semakin tinggi.
Berdasarkan table di atas dapat disimpulkan:
a. Hubungan antara Y dan X1 koefisien korelasinya adalah 0.814 dan signifikansinya 0.002 lebih kecil dari 0.05 yang berarti ada korelasi.
b. Hubungan antara Y dan X2 koefisien korelasinya adalah 0,709 dan signifikansinya 0,011 lebih kecil dari 0,05 yang berarti ada korelasi.
c. Hubungan X1 dan X2 koefisien korelasinya adalah 0.181 dan signifikansinya 0,308 lebih besar dari 0,05 yang bearti tidak ada korelasi.
Table di atas menjelaskan metode regresi yang digunakan untuk menganalisis data dengan program SPSS 17.0. metode yang digunakan adalah metode Enter. Variable X1 dan X2 tidak ada yang dikeluarkan.
Table di atas menjelaskan besarnya presentase pengaruh variable bebas atau variabel prediktor terhadap variabel terikatnya. Besar koefisien determinasi adalah 0,988 mengandung pengertian bahwa pengaruh variabel bebas (independent) terhadap perubahan variabel dependent adalah 98,8 %. Sedangkan 11,2% (100% - 98,8%) dipengaruhi oleh variabel lain. Jadi pengaruh X1 dan X2 terhadap Y sebesar 98,8% sedangkan pengaruh variabel lain 11,2%.
Tabel di atas menjelaskan apakah variasi nilai variabel bebas atau variabel independent dapat menjelaskan variasi nilai dependent dengan menggunakan besarnya nilai F. Besarnya nilai F hitung adalah 285.802 sedangkan besar signifikansinya 0,000. Signifikansi tabel ANOVA 0,000 kurang dari 0,05, dengan demikian Ho ditolak dan Ha diterima. Dengan demikian variasi nilai variabel bebas atau variabel independen dapat menjelaskan variasi nilai dependent, dengan kata lain variabel X1 dan X2 ada hubungan linear dengan variabel Y.
Karena nilai signifikansi 0,000 untuk konstanta, X1 dan X2 , sehingga Ho ditolak untuk semua uji. Jadi konstanta dan koefisien regresi dan signifikan. Persamaan regresi dugaannya adalah:
Hasil uji multikolinearitas dapat dilihat pada nilai VIF, yaitu 1,034 < 10, sehingga dapat disimpulkan tidak ada multikolinearitas antara variabel X1 dan X2.
http://www.ziddu.com/download/22222873/DATA.xlsx.html data excel nya
Tidak ada komentar:
Posting Komentar