P12 Analisis Variansi (ANOVA)

  • Published on
    02-Feb-2016

  • View
    16

  • Download
    0

Embed Size (px)

DESCRIPTION

Penjelasan mengenai uji analisis anova untuk anak kuliah

Transcript

  • 11

    Vembri Noor Helia, ST., MT.

    Penyebaran Data atau Variasi :

    Variansi

    Variansi (variance 2s atau 2 ), adalah ukuran yang menunjukkan rata-rata kuadrat penyimpangan data dari nilai rata-rata data (mean value). Variansi dihitung sebagai berikut

    )1/()(1

    22

    nxxsn

    ii ,

    dimana (n-1) adalah derajat kebebasan (degree of freedom) dari sejumlah n data setelah berkurang satu karena telah digunakan untuk menghitung nilai rata-rata x . Dari perhitungan tersebut, dapat diturunkan cara perhitungan lain yang dinilai lebih mudah untuk penghitungan secara manual sebagai berikut

    )1/(/)(11

    22

    nnxxsn

    ii

    n

    ii .

    2

    Ada cara perhitungan lain yang dilakukan dengan melihat perbedaan setiap pasang data seperti pada persamaan berikut

    )1(2/)(1 1

    22

    nnxxsn

    i

    n

    jji .

    Dengan cara ini, tidak terlihat adanya perhitungan nilai rata-rata (lokasi pemusatan data). Penggunaan (n-1) sebagai ganti n menghasilkan estimasi tidak bias untuk variansi populasi. Jika digunakan nilai rata-rata yang bukan berasal dari data (misalkan diketahui ), maka derajat

    kebebasannya (degree of freedom) tetap berjumlah n, dan variansi dihitung

    sebagai berikut nxsn

    ii /)(

    1

    22

    .

    3

    Simpangan baku Simpangan baku atau standard deviation (s atau ) menunjukkan rata-rata penyimpangan data dari nilai rata-ratanya, atau akar

    kuadrat dari variansi )1/()(1

    2

    nxxsn

    ii atau

    nxsn

    ii /)(

    1

    2

    . Dalam distribusi normal, rata-rata

    menunjukkan parameter lokasi, sedangkan deaviasi standar menunjukkan parameter skala (sebagai kluster data-data observasi). Statistik ini memiliki bias yang besarnya dapat dilihat

    sebagai faktor koreksi )34/()1(44 nnc (lihat tabel pada

    buku pengendalian kualitas).

    4

    Koefisien variasi Koefisien variasi (coefficeint of variation, CV) diberikan oleh persamaan berikut (biasanya dinyatakan dalam %)

    xsCV / . Statistik ini penting, karena menghasilkan skala yang memiliki nilai nol yang mutlak dan digunakan untuk membandingkan variasi antara dua variabel yang berbeda dimensi

    Rentang Rentang atau range (R) adalah ukuran yang menunjukkan selisih antara data terbesar dengan data terkecil pada sebuah kelompok data. Nilai simpangan baku dapat diestimasi dengan menggunakan rata-rata rentang R yang dikonversikan sebagai

    2/ dRs , dimana 2d (ditentukan oleh ukuran sampel).

    n 2 3 4 5 6 7 8 9 10

    2d 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078

    5

    Perhatikan contoh berikut: Diperoleh data nilai hasil penjualan dua jenis produk di beberapa outlet untuk perioda bulan yang lalu dan bulan ini sebagai berikut:

    Produk A Produk B

    Outlet Bulan lalu Bulan ini Bulan lalu Bulan ini

    East 89.7 87.3 84.7 86.3 West 81.4 79.7 86.1 79.3 North 84.5 85.1 83.2 82.6 South 84.8 81.7 91.9 89.1

    (dalam Rp. 000.000,-)

    Rata-rata hasil penjualan produk A (84.28), dan produk B (85.40)

    Rata-rata hasil penjualan bulan lalu (85.79), dan bulan ini (83.89)

    Rata-rata hasil penjualan outlet East (87), West (81.63), North (83.85), dan South (86.88)

    6

  • 2Dari data-data tersebut muncul pertanyaan berikut: Apakah ada perbedaan nilai penjualan dilihat dari faktor-faktor jenis produk, perioda waktu penjualan atau lokasi penjualan (outlet)? Apakah ada pengaruh bersama (interaksi) dari faktor-faktor tersebut sehingga terdapat variasi pada nilai penjualan?

    7 8

    ANOVA (ANalysis Of VAriance)

    adalah metoda statistika untuk menentukan keberadaan (existence) perbedaan (differences) dari beberapa rata-rata populasi.

    9

    ANOVA dirancang untuk mendeteksi perbedaan dari rata-rata populasi karena adanya perbedaan perlakukan (treatments) tertentu.

    ANOVA adalah pengujian terpadu (joint test) Kesamaan beberapa rata-rata populasi diuji secara

    bersamaan atau simultan.

    ANOVA menguji kesamaan beberapa rata-rata populasi dengan mengevaluasi dua estimator variansi populasi (karenanya disebut analysis of variance).

    10

    Diperlukan r sampel random independen dimana setiap sampel berkaitan dengan sebuah perlakuan tertentu.

    Total observasi yang diperlukan adalah n = n1+ n2+ n3+ ...+nr.

    Sehingga rata-rata sampel: x1, x2 , x3 , ... , xr Rata-rata sampel ini digunakan untuk menghitung estimator

    variansi populasi. Jika rata-rata populasi sama maka variansi diantara rata-rata sampel tersebut kecil.

    Variansi sampel : s12, s22, s32, ...,sr2

    Variansi sampel ini digunakan untuk menentukan pooled estimator dari variansi populasi.

    11

    Asumsikan sampling random independen dari setiap populasi.

    Asumsikan pula bahwa populasi tersebut: Berdistribusi normal,

    memiliki rata-rata i (dapat sama atau berbeda),

    dengan variansi yang sama, i2.

    1 2 3

    Population 1 Population 2 Population 3

    Statistik uji:

    F(r-1, n-r) =Estimasi variansi dari rata-rata sampel

    Estimasi variansi dari seluruh observasi

    Statistik uji dalam analisis variansi dilandasi oleh rasio dua estimator

    variansi dengan (r-1) degrees of freedom untuk pembilang dan (n-r)

    degrees of freedom untuk penyebut.

    Uji hipotesis:

    H0: 1 = 2 = 3 = 4 = ... rH1: tidak semua i (i = 1, ..., r) sama

    12

  • 3x

    x

    x

    Jika hipotesis awal benar:

    Diharapkan bahwa rata-rata sampel hampir

    bernilai sama, karenya diharapkan juga bahwa

    variasi diantara rata-rata sampel (between

    sample) kecil, relatif terhadap variasi pada rata-

    rata sampel tertentu (within sample).

    Jika hipotesisi awal benar, pembilang pada

    statistik uji kecil, relatif terhadap pembilang:

    F(r-1, n-r)=Estimate of variance based on means from r samples

    Estimate of variance based on all sample observations

    H0:

    13

    x xx

    Jika hipotesis awal salah:

    is equal to but not to ,

    is equal to but not to ,

    is equal to but not to , or

    , , and are all unequal.

    Dalam kondisi tersebut diinginkan variansi diantara rata-rata sampel (between

    sample) besar relatif terhadap variasi disekitar rata-rata sampel individual (within

    sample).

    Jika hipotesis awal tidak dapat diterima, statistik uji pembilang besar relatif

    terhadap penyebut:

    F(r-1, n-r)=Estimate of variance based on means from r samples

    Estimate of variance based on all sample observations

    14

    15

    Dari 4 populasi, diambil sampel random n1 + n2 + n3 + n4 = 54. Statistik uji :

    F(4-1, 54-4)= F(3,50) =Estimate of variance based on means from 4 samples

    Estimate of variance based on all 54 sample observations

    543210

    0.7

    0.6

    0.5

    0.4

    0.3

    0.2

    0.1

    0.0F(3,50)

    f (F)

    FDistributionwith3 and 50 Degrees of Freedom

    2.79

    a=0.05

    Area penerimaan (untuk a=0.05) adalah F

    2.79, dan area penolakan F > 2.79. Jika

    statustik uji kurang dari 2.79 maka hipotesis

    awal diterima, dan disimpulkan rata-rata 4

    populasi sama. Sebaliknya jika statistik uji

    lebih besar dari 2.79, hipotesis awal ditolak,

    artinya rata-rata ke-4 populasi tidak sama.

    Randomly chosen groups of customers were served different types of coffee and asked to rate the

    coffee on a scale of 0 to 100: 21 were served pure Brazilian coffee, 20 were served pure Colombian

    coffee, and 22 were served pure African-grown coffee.

    The resulting test statistic was F = 2.02

    berbeda). signifikan secara(tidak sama dianggap populasi

    rata-rata ketiga artinya ditolak,dapat tidak 0

    H

    15.360,2

    02.2

    15.360,2363,13)-(,1-

    :adalah 0.05=untuk kritis Batas

    3=r

    63=22+20+21=n 22=3

    n 20=2

    n 21=1

    n

    equal means threeallNot :1

    H321

    :0

    H

    FF

    FFrnr

    F

    a

    543210

    0.7

    0.6

    0.5

    0.4

    0.3

    0.2

    0.1

    0.0F

    f( F)

    F Distribution with 2 and 60 Degrees of Freedom

    a=0.05

    Test Statistic=2.02 F(2,60)=3.15

    16

    Rata-rata total , x, adalah rata-rata dari n = n1+ n2+ n3+...+ nr observasi dari

    seluruh r sampel.

    i. -ke populasi dari sampel dalam j-ke dataadalah ij

    dimaan x

    1 =1 ij

    x1

    =

    :points) data (all totalrata-Rata

    1 ij

    x

    =

    :r)1,2,3,...,=(i i sampel rata-Rata

    i

    ni

    n

    in

    j

    r

    ii

    x

    in

    in

    ji

    x

    r

    ixn

    17 18

    Jika rata-rata r populasi berbeda (paling

    tidak dua populasi), maka variasi data di

    sekitar rata-rata populasi tersebut (within

    sample variation) akan kecil relatif

    terhadap variasi rata-rata r sampel di

    sekitar rata-rata total (between sample

    variation).

    Distance from data point to its sample mean

    Distance from sample mean to grand mean

    1050

    x3=2

    x2=11.5

    x1=6

    x=6.909

    Treatment (j) Sample point(j) Value(xij)i=1 Triangle 1 4Triangle 2 5Triangle 3 7Triangle 4 8

    Mean of Triangles 6i=2 Square 1 10Square 2 11Square 3 12Square 4 13

    Mean of Squares 11.5i=3 Circle 1 1Circle 2 2Circle 3 3

    Mean of Circles 2Grand mean of all data points 6.909

  • 4e x xij ij i

    t x xi i

    Prinsip ANOVA (hipotesis awal):

    Jika rata-rata populasi tidak sama, rata-rata error (within

    sample) kecil dibandingkan