L Abaci: ANALISIS REGRESI GANDA

ANALISIS REGRESI GANDA

MODEL

Regresi linear ganda adalah persamaan regresi yang menggambarkan hubungan antara lebih dari satu variabel bebas (x) dan satu variabel tidak bebas (y).

Persamaannya adalah

Regresi linear ganda untuk dua variabel bebas

Persamaannya adalah:

Dimana = Variabel terikat, = Variabel bebas, (regresi konstan) = intersep atau perpotongan dengan sumbu tegak , dan = parameter model regresi dan = kesalahan variabel bebas. Sebagai contoh data untuk menjelaskan proses perhitungan sebagai berikut:

3 2 1

2 3 5

4 5 3

5 7 6

8 8 7

Nilai dari koefisien , dan dapat ditentukan dengan cara:

Metode kuadrat terkecil

Sebagai contoh data untuk menjelaskan proses perhitungan sebagai berikut:

3 2 1

2 3 5

4 5 3

5 7 6

8 8 7

Sehingga persamaan regresi linier bergandanya adalah

Menggunakan Matriks

kita mengambil model setiap subjek skor y sebagai fungsi linear dari

Rangkaian persamaan dapat dinyatakan sebagai persamaan matriks tunggal:

itu sangat jelas bahwa skor y dan e mendefinisikan vektor kolom, sedangkan tidak begitu jelas adalah bagaimana kotak di bidang dapat direpresentasikan sebagai produk dari dua matriks

kolom pertama dari matrik digunakan untuk memperoleh regresi konstan. sisanya dua kolom berisi nilai untuk subjek pada dua prediktor. Sehingga persamaan matriks untuk regresi berganda adalah:

y = Xβ + e

sekarang, dapat ditunjukkan dengan menggunakan kalkulus bahwa kuadrat terkecil perkiraan β diberikan oleh:

sehingga data keluar koefisien regresi yang ditaksir akan menjadi:

Langkah pertama :

dan

Langkah selanjutnya, menunjukkan bahwa:

dimana 1016 adalah determinan dari X’X. sehingga perkiraan koefisien regresi diberikan oleh:

oleh karena itu, persamaan regresi (variabel bebas) adalah

untuk menggambarkan penggunaan persamaan ini, kita menemukan nilai prediksi untuk 3 subjek dan sisa untuk subjek:

= .5 + 5 – .25(3) = 4.75

= = 4 – 4.75 = – .75

Matematis Maksimalisasi Sifat Dasar Kuadrat Terkecil Regresi

Secara umum kemudian, dalam regresi linier berganda kombinasi linier dari x maksimal dikorelasikan dengan y yang dicari. Meminimalkan jumlah kesalahan kuadrat dari prediksi setara dengan memaksimalkan hubungan antara pengamatan dan prediksi skor y. korelasi Pearson yang dimaksimumkan Ini disebut korelasi berganda, ditunjukkan sebagai R = . Nunnally (1978) menandaia prosedur sebagai daya prediksi yang terakhir (diperoleh dari kombinasi linier dari x's dari persamaan regresi.). Karena hubungan yang maksimum untuk sampel asal, ketika persamaan regresi diterapkan untuk sampel independent dari populasi yang sama (misalnya, cross-divalidasi), diprediksikan power tidak ada. Jika prediksi power kuat, maka kegunaan persamaan terbatas. Artinya, ia tidak digeneralisasikan, dan karenanya adalah nilai ilmiah yang terbatas. Bagaimanapun, kita peroleh persamaan prediksi untuk tujuan memprediksi sampel (lainnya) . Jika persamaan tidak memprediksi baik pada sampel lainnya, maka tidak memenuhi tujuan yang telah dirancang.

Ukuran sampel (n) dan jumlah prediktor (k) adalah dua faktor penting yang menentukan seberapa baik suatu persamaan yang diberikan akan cross-validasi (mis. generalisasi). Secara khusus, n / k rasio sangat penting. Untuk rasio yang kecil (5:1 atau kurang) penyusutan daya prediksi sangat besar. Sebuah studi oleh Guttman (1941) menggambarkan poin ini. Dia telah melakukan penelitian136 subyek dan 84 prediktor. dan menemukan korelasi berganda pada sampel asli sebanyak 73. Namun, ketika persamaan prediksi diterapkan pada sampel independen korelasi yang baru hanya 0,04! Dengan kata lain, daya prediksi yang baik pada sampel asli disebabkan oleh kapitalisasi pada peluang, dan persamaan prediksi itu tidak generalisasi.

Uraian Jumlah Kuadrat dalam Regresi dan Uji F untuk Korelasi Berganda

Dalam analisis varians kegagalan variabilitas terhadap mean besar di antara dan di dalam keragaman. dalam analisis regresi variabilitas dari mean dipecah menjadi variabilitas disebabkan oleh regresi dan variabilitas regresi. Untuk mendapatkan rinciannya, kita mulai dengan identitas sebagai berikut:

sekarang kita kuadrat kedua belah pihak, mendapatkan:

maka kita jumlahkan subjek di atas, dari 1 sampai n:

dengan menggunakan manipulasi aljabar, dapat ditulis sebagai:

Jumlah kuadrat Jumlah kuadrat Jumlah kuadrat

rata-rata = regresi + regresi yang seharusnya

( (

Df: n – 1 = (n – k – 1) + k(df = degres of freedom)

Hasil dalam analisis berikut tabel varians dan uji F untuk menentukan apakah beberapa korelasi populasi berbeda dari 0.

Tabel ANAVA untuk regresi

Source SS df MS F

Regresi k

Residual n – k – 1 n – k – 1)

(error)

ingat bahwa karena sisa untuk setiap subyek = , istilah kesalahan mean square dapat ditulis sebagai = . Sekarang (korelasi berganda kuadrat) diberikan oleh

demikian, mengukur proporsi total varians y yang dicatat dengan seperangkat prediktor. oleh aljabar sederhana maka kita dapat menulis ulang uji F dalam jangka waktu sebagai berikut:

F = 3.9 dengan df 10 dan 39

kami merasa tes ini adalah kegunaan batas, karena tidak perlu berarti bahwa persamaan akan melakukan validasi silang dengan baik, dan ini adalah isu penting dalam analisis regresi.

Pendugaan Dan Pengujian Koefisien Regresi

1. Kesalahan Baku Regresi dan Koefesien Regresi Ganda

Kesalahan baku atau selisih taksir standar regresi adalah nilai yang menyatakan seberapa jauh menyimpangnya nilai regresi tersebut terhadap nilai sebenarnya (nilai observasi). Nilai ini digunakan untuk mengukur tingkat ketepatan suatu penduga dalam menduga suatu nilai. Jika nilai ini sama dengan 0 (nol), maka penduga tersebut memiliki tingkat ketepatan 100%.

Kesalahan baku atau selisih taksir standar regresi ganda, dirumuskan :

Keterangan :

S_e = Kesalahan baku regresi ganda

n = Jumlah pasangan observasi

m = Jumlah konstanta dalam persamaan regresi ganda

Untuk koefisien regresi ganda b₁ dan b₂, kesalahan bakunya dirumuskan :

Keterangan :

dan = kesalahan baku koefisien regresi ganda dan

= koefisien korelasi antara X₁ dan X₂

Atau untuk secara umumnya, dengan menggunakan matrix dapat menggunakan rumus:

Rumus diatas jauh lebih sederhana dan dapat digunakan untuk persamaan regresi yang koefisien b nya lebih dari 2. Contoh penghitungan dengan menggunakan matrix dapat dilihat pada file excel.

2. Pendugaan Interval Koefisien Regresi Ganda (Parameter dan )

Parameter dan sering juga disebut sebagai koefisien regresi parsial. Pendugaan parameter dan menggunakan distribusi t dengan derajat bebas (df) = n-k-1.

Secara umum, pendugaan parameter dan adalah

3. Pengujian Hipotesis Koefisien Regresi Ganda (Parameter dan )

Pengujian hipotesis bagi koefisien regresi ganda atau regresi parsial parameter dan dapat dibedakan menjadi dua bentuk, yaitu pengujian hipotesis serentak dan pengujian hipotesis individual.

a. Pengujian hipotesis serentak (uji F)

Pengujian hipotesis serentak merupakan pengujian hipotesis koefisien regresi ganda dengan B₁dan B₂ serentak atau bersama-sama mempengaruhi Y. langkah-langkah pengujiannya ialah sebagai berikut:

1) Menentukan formulasi hipotesis

H₀ : (X₁ dan X₂ tidak mempengaruhi Y)

H₁ : (minimal salah satu tidak sama dengan 0), (X₁ dan X₂ mempengaruhi Y atau paling sedikit ada X yang mempengaruhi Y)

2) Menentukan taraf nyata (α) dan nilai F tabel

Taraf nyata (α) dan nilai F tabel ditentukan dengan derajat bebas v₁ = k dan
v₂ = n-k-1

3) Menentukan kriteria pengujian

H₀ diterima apabila

H₀ ditolak apabila

4) Menentukan nilai uji statistik dengan tabel ANOVA

Tabel ANOVA

Source	SS	df	MS	F₀
Regresi Residual (error)	SS_reg SS_res	k n-k-1	SS_reg/k SS_res/(n-k-1)
Total	SS	n – 1

5) Membuat kesimpulan

Menyimpulkan apakah H₀ diterima atau ditolak

Contoh soal:

Dengan menggunakan data Tabel, ujilah bahwa X₁ dan X₂ tidak mempengaruhi Y, dengan alternatif paling tidak satu yang mempengaruhi Y! Gunakan taraf nyata 1%!

Penyelesaian:

1. Formulasi hipotesisnya:

H₀ : B₁ = B₂ = 0

H₁ : B₁≠ 0 atau B₂ ≠ 0

2. Taraf nyata (α) dan nilai F tabelnya:

α = 1% = 0,01

v₁ = 2 dan v₂ = 10 - 2 - 1 = 7

3. Kriteria pengujiannya:

H₀ diterima apabila

H₀ ditolak apabila

4. Nilai uji statistik (F₀) dengan tabel ANOVA

Sumber Variasi	SS	df	MS	F₀
Regresi	962,176	2	481,088
(X₁, X₂)				273,19
Error	12,324	7	1,761
Total	974,5	9

5. Kesimpulan:

Karena , maka H₀ ditolak. Jadi, ada pengaruh dari X₁ dan X₂ terhadap Y.

Cara penghitungan dengan metode matrix

Formulasi hipotesisnya:

H₀ : B₁ = B₂ = 0

H₁ : B₁≠ 0 atau B₂ ≠ 0

Taraf nyata (α) dan nilai F tabelnya:

α = 1% = 0,01

v₁ = 2 dan v₂ = 10 - 2 - 1 = 7

Kriteria pengujiannya:

H₀ diterima apabila

H₀ ditolak apabila

Penghitungan:

Maka

Sehingga persamaan Regresinya

Kesimpulan

Karena , maka H₀ ditolak. Jadi, ada pengaruh dari X₁ dan X₂ terhadap Y.

b. Pengujian hipotesis individual

Pengujian hipotesis individual merupakan pengujian hipotesis koefisien regresi ganda dengan hanya satu B (B₁ atau B₂) yang mempengaruhi Y. langkah-langkah pengujiannya ialah sebagai berikut:

1) Menentukan formulasi hipotesis

H₀ : B_i = 0 (tidak ada pengaruh X_iterhadap Y)

H₁ : B_i> 0 (ada pengaruh positif X_i terhadap Y)

B_i< 0 (ada pengaruh negatif X_i terhadap Y)

B_i ≠ 0 (ada pengaruh X_iterhadap Y)

2) Menentukan taraf nyata (α) dengan t tabel

Taraf nyata dari t tabel ditentukan dengan derajat bebas (db) = n – k.

3) Menentukan kriteria pengujian

Kriteria pengujian yang ditentukan sama dengan kriteria pengujian dari pengujian hipotesis yang menggunakan distribusi t.

4) Menentukan nilai uji statistik

5) Membuat kesimpulan

Menyimpulkan apakah H₀ diterima atau ditolak

Contoh soal:

Dengan menggunakan data Tabel, ujilah pendapat yang mengatakan sebagai berikut.

a. Tidak ada pengaruh nilai uji terhadap output pekerja, dengan alternatif ada pengaruh negatif. Pergunakan taraf nyata 5%!

b. Tidak ada pengaruh pengalaman kerja terhadap output pekerja, dengan alternatif ada pengaruh positif. Pergunakan taraf nyata 5%!

Penyelesaian:

a. Pengujian hipotesis B₁

1) Formulasi hipotesisnya:

H₀ : B₁ = 0 (tidak ada pengaruh negatif)

H₁ : B₁< 0 (ada pengaruh negatif)

2) Taraf nyata (α) dengan nilai t tabelnya:

α = 5% = 0,05 dengan df = 10 – 2 – 1 = 7

(uji sisi kiri)

3) Kriteria pengujiannya:

H₀ diterima apabila t₀ ≥ - 1,895

H₀ ditolak apabila t₀< - 1,895

4) Nilai uji statistik (t₀):

5) Kesimpulan:

Karena , maka H₀ diterima. Jadi, tidak ada pengaruh negatif nilai uji terhadap output pekerja.

b. Pengujian hipotesis B₂

1) Formulasi hipotesisnya:

H₀ : B₂ = 0 (tidak ada pengaruh positif)

H₁ : B₂> 0 (ada pengaruh positif)

2) Taraf nyata (α) dengan nilai t tabelnya:

α = 5% = 0,05 dengan db = 7

(uji sisi kanan)

3) Kriteria pengujiannya:

H₀ diterima apabila t₀ ≤ 1,895

H₁ ditolak apabila t₀> 1,895

4) Nilai uji statistik (t₀):

5) Kesimpulan:

Karena , maka H₀ ditolak. Jadi, ada pengaruh positif pengalaman kerja terhadap output.

Cara penghitungan dengan metode matrix

Maka

Sehingga persamaan Regresinya

Maka

Pengujian hipotesis B₁

1) Formulasi hipotesisnya:

H₀ : B₁ = 0 (tidak ada pengaruh positif)

H₁ : B₁> 0 (ada pengaruh positif)

2) Taraf nyata (α) dengan nilai t tabelnya:

α = 5% = 0,05 dengan df = 10 – 2 – 1 = 7

3) Kriteria pengujiannya:

H₀ diterima apabila t₀ ≤ 1,895

H₀ ditolak apabila t₀> 1,895

4) Nilai uji statistik (t_hitung):

5) Kesimpulan:

Karena , maka H₀ ditolak. Jadi, tidak ada pengaruh positif nilai uji terhadap output pekerja.

Pengujian hipotesis B₁

1) Formulasi hipotesisnya:

H₀ : B₂ = 0 (tidak ada pengaruh positif)

H₁ : B₂> 0 (ada pengaruh positif)

2) Taraf nyata (α) dengan nilai t tabelnya:

α = 5% = 0,05 dengan df = 10 – 2 – 1 = 7

3) Kriteria pengujiannya:

H₀ diterima apabila t₀ ≤ 1,895

H₀ ditolak apabila t₀> 1,895

4) Nilai uji statistik (t_hitung):

5) Kesimpulan:

Karena , maka H₀ ditolak. Jadi, tidak ada pengaruh positif nilai uji terhadap output pekerja.

Analisis Regresi Ganda dengan Microsoft Excel 2007

Berikut langkah-langkah menganalisis Regresi Ganda dengan menggunakan Microsoft Excel 2007:

1. Buka Microsoft Excel

2. Jika data analysis belum tersedia pada tab data, maka lakukan instalasi dengan cara berikut:

a. Klik Microsoft Office Button, kemudian klik Excel Options

b. Klik Add-Ins, kemudian pada Manage box, pilih Excel Add-ins. Klik Go

c. Pada box Add-Ins available, pilih AnalysisnToolPack, beri conteng kemudian klik OK

3. Jika instalasi data analysis telah selesai, input data pada cells excel.

4. Blok data kemudian pada tab data klik data analysis, pilih regretion

5. Pada input Y range, input cells Y pada data. Dan pada input X range, input cells dan pada data. Pada output range klik cells yang kosong pada sheet. Beri tanda conteng pada Residual. Kemudian klik OK.

6. Tampilan akhir adalah seperti berikut

Analisis Regresi Ganda dengan Program SPSS 17.0

Selain menggunakan Microsoft office excel, analisis regresi ganda juga dapat diselesaikan dengan menggunakan program SPSS. Berikut langkah menyelesaikan analisis regresi ganda dengan menggunakan program tersebut:

1. Jalankan program SPSS 17.0

2. Entri data ke dalam programSPSS kemudian simpan dalam bentuk file misalnya dengan nama Data.

3. Analisis regresi dengan program SPSS dengan prosedur: klik Analyze, pilih Regression, klik Linear

4. Masukkan Y ke dalam kotak Dependent, kemudian X1 dan X2 ke dalam kotak Independen(s). pilih enter pada method.

5. Pada kotak Statistics, pada menu Regression Coefficients , pilih kotak Estimates, Model Fit, pada Residuel klik Durbin Watson (untuk menunjukkan hasil uji asumsi autokorelasi). Lalu klik Continue.

6. Pada kotak menu Options (Stepping Methode Criteria), kotak menu Include Constant in Equation adalah fasilitas bila ingin menampilkan konstanta persamaan garis regresi, biarkan dalam keadaann di checklist. Kotak menu Missing Values adalah menu untuk mengatasi adanya data hilang atau kosong serta data yang tidak tersedia dengan beberapa alternative pilihan pemecahannya, klik pada Exclude Cases Listwise, klik Continue

7. Klik OK dan tunggu beberapa saat akan keluar output nya

Out dan Interpretasi Regresi Ganda

Table di atas adalah table statistic deskriptif yang menyaikan besarnya nilai rata-rata (mean), standar deviasi dan N masing-masing variable.

Table di atas merupakan mattiks korelasi variable Y, X₁, dan X₂. Besarnya N masing-masing variable adalah 10 dan teknik analisis yang digunakan yaitu Pearson Correlation, dari output di atas dapat dibuat interpretasi korelasi yaitu:

1. Bila besarnya nilai probabilitas atau sig. (1-tiled) lebih kecil dari 0,05 maka H₀ ditolak. Ini berarti adal korelasi yang signifikan.

2. Bila koefisien kerelasi bertanda positif, menunjukkan arah korelasinya positif (searah), mengandung pengertian semakin tinggi skor variabel pertama maka semakin tinggi pula skor variabel kedua, sebaliknya semakin rendah skor variabel pertama maka skor variabel kedua semakin rendah.

3. Bila koefisien korelasi bertanda negatif. Menunjukkan arah korelasinya negatif (berlawanan arah), mengandung pengertian semakin tinggi skor variabel pertama maka semakin rendah pula skor variabel kedua, sebaliknya semakin rendah skor variabel pertama maka skor variabel kedua semakin tinggi.

Berdasarkan table di atas dapat disimpulkan:

a. Hubungan antara Y dan X₁ koefisien korelasinya adalah 0.814 dan signifikansinya 0.002 lebih kecil dari 0.05 yang berarti ada korelasi.

b. Hubungan antara Y dan X₂ koefisien korelasinya adalah 0,709 dan signifikansinya 0,011 lebih kecil dari 0,05 yang berarti ada korelasi.

c. Hubungan X₁ dan X₂ koefisien korelasinya adalah 0.181 dan signifikansinya 0,308 lebih besar dari 0,05 yang bearti tidak ada korelasi.

Table di atas menjelaskan metode regresi yang digunakan untuk menganalisis data dengan program SPSS 17.0. metode yang digunakan adalah metode Enter. Variable X₁ dan X₂ tidak ada yang dikeluarkan.

Table di atas menjelaskan besarnya presentase pengaruh variable bebas atau variabel prediktor terhadap variabel terikatnya. Besar koefisien determinasi adalah 0,988 mengandung pengertian bahwa pengaruh variabel bebas (independent) terhadap perubahan variabel dependent adalah 98,8 %. Sedangkan 11,2% (100% - 98,8%) dipengaruhi oleh variabel lain. Jadi pengaruh X₁dan X₂terhadap Y sebesar 98,8% sedangkan pengaruh variabel lain 11,2%.

Tabel di atas menjelaskan apakah variasi nilai variabel bebas atau variabel independent dapat menjelaskan variasi nilai dependent dengan menggunakan besarnya nilai F. Besarnya nilai F hitung adalah 285.802 sedangkan besar signifikansinya 0,000. Signifikansi tabel ANOVA 0,000 kurang dari 0,05, dengan demikian H_o ditolak dan H_a diterima. Dengan demikian variasi nilai variabel bebas atau variabel independen dapat menjelaskan variasi nilai dependent, dengan kata lain variabel X₁ dan X₂ ada hubungan linear dengan variabel Y.

Karena nilai signifikansi 0,000 untuk konstanta, X₁ dan X₂, sehingga H_o ditolak untuk semua uji. Jadi konstanta dan koefisien regresi dan signifikan. Persamaan regresi dugaannya adalah:

Hasil uji multikolinearitas dapat dilihat pada nilai VIF, yaitu 1,034 < 10, sehingga dapat disimpulkan tidak ada multikolinearitas antara variabel X₁ dan X₂.

http://www.ziddu.com/download/22222865/data.rar.html data spssnya

http://www.ziddu.com/download/22222873/DATA.xlsx.html data excel nya

L Abaci

Rabu, 07 September 2016

ANALISIS REGRESI GANDA

Tidak ada komentar:

Posting Komentar