P12 Analisis Variansi (ANOVA)

  • Published on
    02-Feb-2016

  • View
    15

  • Download
    0

Embed Size (px)

DESCRIPTION

Penjelasan mengenai uji analisis anova untuk anak kuliah

Transcript

  • 11

    Vembri Noor Helia, ST., MT.

    Penyebaran Data atau Variasi :

    Variansi

    Variansi (variance 2s atau 2 ), adalah ukuran yang menunjukkan rata-rata kuadrat penyimpangan data dari nilai rata-rata data (mean value). Variansi dihitung sebagai berikut

    )1/()(1

    22

    nxxsn

    ii ,

    dimana (n-1) adalah derajat kebebasan (degree of freedom) dari sejumlah n data setelah berkurang satu karena telah digunakan untuk menghitung nilai rata-rata x . Dari perhitungan tersebut, dapat diturunkan cara perhitungan lain yang dinilai lebih mudah untuk penghitungan secara manual sebagai berikut

    )1/(/)(11

    22

    nnxxsn

    ii

    n

    ii .

    2

    Ada cara perhitungan lain yang dilakukan dengan melihat perbedaan setiap pasang data seperti pada persamaan berikut

    )1(2/)(1 1

    22

    nnxxsn

    i

    n

    jji .

    Dengan cara ini, tidak terlihat adanya perhitungan nilai rata-rata (lokasi pemusatan data). Penggunaan (n-1) sebagai ganti n menghasilkan estimasi tidak bias untuk variansi populasi. Jika digunakan nilai rata-rata yang bukan berasal dari data (misalkan diketahui ), maka derajat

    kebebasannya (degree of freedom) tetap berjumlah n, dan variansi dihitung

    sebagai berikut nxsn

    ii /)(

    1

    22

    .

    3

    Simpangan baku Simpangan baku atau standard deviation (s atau ) menunjukkan rata-rata penyimpangan data dari nilai rata-ratanya, atau akar

    kuadrat dari variansi )1/()(1

    2

    nxxsn

    ii atau

    nxsn

    ii /)(

    1

    2

    . Dalam distribusi normal, rata-rata

    menunjukkan parameter lokasi, sedangkan deaviasi standar menunjukkan parameter skala (sebagai kluster data-data observasi). Statistik ini memiliki bias yang besarnya dapat dilihat

    sebagai faktor koreksi )34/()1(44 nnc (lihat tabel pada

    buku pengendalian kualitas).

    4

    Koefisien variasi Koefisien variasi (coefficeint of variation, CV) diberikan oleh persamaan berikut (biasanya dinyatakan dalam %)

    xsCV / . Statistik ini penting, karena menghasilkan skala yang memiliki nilai nol yang mutlak dan digunakan untuk membandingkan variasi antara dua variabel yang berbeda dimensi

    Rentang Rentang atau range (R) adalah ukuran yang menunjukkan selisih antara data terbesar dengan data terkecil pada sebuah kelompok data. Nilai simpangan baku dapat diestimasi dengan menggunakan rata-rata rentang R yang dikonversikan sebagai

    2/ dRs , dimana 2d (ditentukan oleh ukuran sampel).

    n 2 3 4 5 6 7 8 9 10

    2d 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078

    5

    Perhatikan contoh berikut: Diperoleh data nilai hasil penjualan dua jenis produk di beberapa outlet untuk perioda bulan yang lalu dan bulan ini sebagai berikut:

    Produk A Produk B

    Outlet Bulan lalu Bulan ini Bulan lalu Bulan ini

    East 89.7 87.3 84.7 86.3 West 81.4 79.7 86.1 79.3 North 84.5 85.1 83.2 82.6 South 84.8 81.7 91.9 89.1

    (dalam Rp. 000.000,-)

    Rata-rata hasil penjualan produk A (84.28), dan produk B (85.40)

    Rata-rata hasil penjualan bulan lalu (85.79), dan bulan ini (83.89)

    Rata-rata hasil penjualan outlet East (87), West (81.63), North (83.85), dan South (86.88)

    6

  • 2Dari data-data tersebut muncul pertanyaan berikut: Apakah ada perbedaan nilai penjualan dilihat dari faktor-faktor jenis produk, perioda waktu penjualan atau lokasi penjualan (outlet)? Apakah ada pengaruh bersama (interaksi) dari faktor-faktor tersebut sehingga terdapat variasi pada nilai penjualan?

    7 8

    ANOVA (ANalysis Of VAriance)

    adalah metoda statistika untuk menentukan keberadaan (existence) perbedaan (differences) dari beberapa rata-rata populasi.

    9

    ANOVA dirancang untuk mendeteksi perbedaan dari rata-rata populasi karena adanya perbedaan perlakukan (treatments) tertentu.

    ANOVA adalah pengujian terpadu (joint test) Kesamaan beberapa rata-rata populasi diuji secara

    bersamaan atau simultan.

    ANOVA menguji kesamaan beberapa rata-rata populasi dengan mengevaluasi dua estimator variansi populasi (karenanya disebut analysis of variance).

    10

    Diperlukan r sampel random independen dimana setiap sampel berkaitan dengan sebuah perlakuan tertentu.

    Total observasi yang diperlukan adalah n = n1+ n2+ n3+ ...+nr.

    Sehingga rata-rata sampel: x1, x2 , x3 , ... , xr Rata-rata sampel ini digunakan untuk menghitung estimator

    variansi populasi. Jika rata-rata populasi sama maka variansi diantara rata-rata sampel tersebut kecil.

    Variansi sampel : s12, s22, s32, ...,sr2

    Variansi sampel ini digunakan untuk menentukan pooled estimator dari variansi populasi.

    11

    Asumsikan sampling random independen dari setiap populasi.

    Asumsikan pula bahwa populasi tersebut: Berdistribusi normal,

    memiliki rata-rata i (dapat sama atau berbeda),

    dengan variansi yang sama, i2.

    1 2 3

    Population 1 Population 2 Population 3

    Statistik uji:

    F(r-1, n-r) =Estimasi variansi dari rata-rata sampel

    Estimasi variansi dari seluruh observasi

    Statistik uji dalam analisis variansi dilandasi oleh rasio dua estimator

    variansi dengan (r-1) degrees of freedom untuk pembilang dan (n-r)

    degrees of freedom untuk penyebut.

    Uji hipotesis:

    H0: 1 = 2 = 3 = 4 = ... rH1: tidak semua i (i = 1, ..., r) sama

    12

  • 3x

    x

    x

    Jika hipotesis awal benar:

    Diharapkan bahwa rata-rata sampel hampir

    bernilai sama, karenya diharapkan juga bahwa

    variasi diantara rata-rata sampel (between

    sample) kecil, relatif terhadap variasi pada rata-

    rata sampel tertentu (within sample).

    Jika hipotesisi awal benar, pembilang pada

    statistik uji kecil, relatif terhadap pembilang:

    F(r-1, n-r)=Estimate of variance based on means from r samples

    Estimate of variance based on all sample observations

    H0:

    13

    x xx

    Jika hipotesis awal salah:

    is equal to but not to ,

    is equal to but not to ,

    is equal to but not to , or

    , , and are all unequal.

    Dalam kondisi tersebut diinginkan variansi diantara rata-rata sampel (between

    sample) besar relatif terhadap variasi disekitar rata-rata sampel individual (within

    sample).

    Jika hipotesis awal tidak dapat diterima, statistik uji pembilang besar relatif

    terhadap penyebut:

    F(r-1, n-r)=Estimate of variance based on means from r samples

    Estimate of variance based on all sample observations

    14

    15

    Dari 4 populasi, diambil sampel random n1 + n2 + n3 + n4 = 54. Statistik uji :

    F(4-1, 54-4)= F(3,50) =Estimate of variance based on means from 4 samples

    Estimate of variance based on all 54 sample observations

    543210

    0.7

    0.6

    0.5

    0.4

    0.3

    0.2

    0.1

    0.0F(3,50)

    f (F)

    FDistributionwith3 and 50 Degrees of Freedom

    2.79

    a=0.05

    Area penerimaan (untuk a=0.05) adalah F

    2.79, dan area penolakan F > 2.79. Jika

    statustik uji kurang dari 2.79 maka hipotesis

    awal diterima, dan disimpulkan rata-rata 4

    populasi sama. Sebaliknya jika statistik uji

    lebih besar dari 2.79, hipotesis awal ditolak,

    artinya rata-rata ke-4 populasi tidak sama.

    Randomly chosen groups of customers were served different types of coffee and asked to rate the

    coffee on a scale of 0 to 100: 21 were served pure Brazilian coffee, 20 were served pure Colombian

    coffee, and 22 were served pure African-grown coffee.

    The resulting test statistic was F = 2.02

    berbeda). signifikan secara(tidak sama dianggap populasi

    rata-rata ketiga artinya ditolak,dapat tidak 0

    H

    15.360,2

    02.2

    15.360,2363,13)-(,1-

    :adalah 0.05=untuk kritis Batas

    3=r

    63=22+20+21=n 22=3

    n 20=2

    n 21=1

    n

    equal means threeallNot :1

    H321

    :0

    H

    FF

    FFrnr

    F

    a

    543210

    0.7

    0.6

    0.5

    0.4

    0.3

    0.2

    0.1

    0.0F

    f( F)

    F Distribution with 2 and 60 Degrees of Freedom

    a=0.05

    Test Statistic=2.02 F(2,60)=3.15

    16

    Rata-rata total , x, adalah rata-rata dari n = n1+ n2+ n3+...+ nr observasi dari

    seluruh r sampel.

    i. -ke populasi dari sampel dalam j-ke dataadalah ij

    dimaan x

    1 =1 ij

    x1

    =

    :points) data (all totalrata-Rata

    1 ij

    x

    =

    :r)1,2,3,...,=(i i sampel rata-Rata

    i

    ni

    n

    in

    j

    r

    ii

    x

    in

    in

    ji

    x

    r

    ixn

    17 18

    Jika rata-rata r populasi berbeda (paling

    tidak dua populasi), maka variasi data di

    sekitar rata-rata populasi tersebut (within

    sample variation) akan kecil relatif

    terhadap variasi rata-rata r sampel di

    sekitar rata-rata total (between sample

    variation).

    Distance from data point to its sample mean

    Distance from sample mean to grand mean

    1050

    x3=2

    x2=11.5

    x1=6

    x=6.909

    Treatment (j) Sample point(j) Value(xij)i=1 Triangle 1 4Triangle 2 5Triangle 3 7Triangle 4 8

    Mean of Triangles 6i=2 Square 1 10Square 2 11Square 3 12Square 4 13

    Mean of Squares 11.5i=3 Circle 1 1Circle 2 2Circle 3 3

    Mean of Circles 2Grand mean of all data points 6.909

  • 4e x xij ij i

    t x xi i

    Prinsip ANOVA (hipotesis awal):

    Jika rata-rata populasi tidak sama, rata-rata error (within

    sample) kecil dibandingkan dengan rata-rata treatment

    (between sample) .

    19

    Error deviation adalah perbedaan antara sebuah data dengan rata-rata sampelnya,

    dan dinyatakan dengan e

    Treatment deviation adalah perbedaan antara sebuah rata-rata sampel dengan

    rata-rata total dan dinyatakan dengan ti

    Untuk data x24=13, rata-rata sampel 2 = 11.5, dan

    rata-rata total 6.909, maka:

    e x x

    t x x

    Tot t e

    Tot x x

    24 24 2 13 11 5 1 5

    2 2 11 5 6 909 4 591

    24 2 24 1 5 4 591 6 091

    24 24 13 6 909 6 091

    . .

    . . .

    . . .

    . .

    or

    1050

    x2=11.5x=6.909

    x24=13

    Total deviation:

    Tot24=x24-x=6.091

    Treatment deviation:

    t2=x2-x=4.591

    Error deviation:

    e24=x24-x2=1.5

    Deviasi total (Totij) adalah berbedaan antara data (xij) dan rata-rata total (x):

    Totij=xij - x

    Untuk setiap data xij: Tot = t + e, artinya:

    Deviasi total = Deviasi karena Treatment + Deviasi karena Error

    20

    2)(2

    2)(2)(=2+ 2

    :deviasiKuadrat

    atas. dipersamaan darin dikeluarkadapat )( sample rata-Rata

    )()()(=+

    :error deviasidan treatmentdeviasijumlah adalah totalDeviasi

    xij

    xij

    Tot

    ix

    ijxx

    ix

    ije

    it

    ix

    ijTotx

    ijx

    ix

    ijxx

    ix

    ije

    it

    Error Deviasi +Treatment Deviasi = Total Deviasi

    21

    1 1

    2)(

    1

    2)(

    in=

    1 1

    2)(

    1 1

    2+

    1

    2

    1 1

    2

    r

    i

    jn

    ji

    xij

    xr

    i

    xi

    xr

    i

    jn

    j

    xij

    x

    r

    i

    jn

    jij

    er

    ii

    ti

    nr

    i

    jn

    jij

    Tot

    deviasikuadrat Jumlah

    The Sum of Squares Principle

    Jumlah kuadrat total (SST) adalah jumlah dari (i) jumlah kuadrat karena

    treatment (SSTr)dan (ii) jumlah kuadrat error (SSE).

    SST = SSTr + SSE

    22

    SST

    SSTr SSE

    SST mengukur variasi total semua data individual terhadap rata-rata total (grand

    mean).

    SSTr mengukur variasi yang dapat dijelaskan (explained variation) antara rata-rata

    sampel terhadap rata-rata total. Variasi ini dijelaskan karena adanya perlakukan

    (treatment) tertentu (between groups of data points).

    SSE mengukur variais yang tidak dapat dijelaskan (unexplained variation) dalam

    setiap sampel (within each group).

    23

    The number of degrees of freedom associated with SST is (n - 1).

    n total observasi pada semua sampel

    The number of degrees of freedom associated with SSTR is (r - 1).

    r jumlah rata-rata sampel

    The number of degrees of freedom associated with SSE is (n-r).

    n total observasi pada semua sampel dan r jumlah rata-rata sampel

    The degrees of freedom bersifat aditif, sehingga:

    df(total) = df(treatment) + df(error)(n - 1) = (r - 1) + (n - r)

    24

  • 5Penghitungan nilai variansi dilakukan dengan membagi jumlah kuadrat

    deviasi dengan jumlah degrees of freedom, disebut sebagai mean squared deviations .

    Mean square treatment (MSTR):

    Mean square error (MSE):

    Mean square total (MST):

    (Note: MST MSTR + MSE).

    MSTRSSTR

    r

    ( )1

    MSESSE

    n r

    ( )

    MSTSST

    n

    ( )1

    25

    E MSE

    E MSTRni i

    r

    i

    ( )

    dan

    ( )( ) jika hipotesisi awal benar

    > jika hipotesisi awal salah

    dimana rata-rata populasi i dan adalah rata-rata r populasi

    2

    22

    1

    2

    2

    Ekspektasi rata-rata kuadrat kesalahan (mean square error (MSE) adalah variansi populasi secara

    umum (asumsikan kesamaan variansi), ekspektasi jumlah kuadrat variasi treatment (MSTR)

    adalah variansi populasi secara umum plus sebuah komponen variasi rata-rata sampel secara

    individual dengan rata-rata total.

    Jika hipotesis awal benar, maka rata-rata setiap populasi adalah sama sehingga komponen

    kedua dari E(MSTR) adalah nol, dan E(MSTR) adalah variansi populasi secara umum 2.

    26

    Jika hipotesis ANOVA benar bahwa r rata-rata populasi sama, population

    means are equal, MSTR dan MSE independent unbiased estimators untuk

    variansi populasi 2.

    Sebaliknya, jika hipotesis tersebut salah maka MSTR akan lebih besar dari

    MSE, atau

    Rasio MSTR terhadap MSE dapat digunakan sebagai indikator

    kesamaan (atau ketidaksamaan) r rata-rata populasi.

    Rasio (MSTR/MSE) akan mendekati satu jika hipotesis tersebut benar, dan

    lebih besar dari satu jika ada kecenderungan hipotesis tersebut salah. Uji

    dengan ANOVA adalah menguji apakah rasio (MSTR/MSE) sama dengan

    satu , atau lebih besar dari satu.

    27

    Rasio (MSTR/MSE) mengikuti distribusi F dengan degrees of freedom

    (r-1) untuk pembilang dan (n-r) untuk penyebut.

    Statistik uji untuk analisis variansi:

    ( - , - )FMSTR

    MSEr n r1

    28

    ( )2

    ni

    ( )2

    Critical p oint ( = 0.01): 8.65

    H0

    may be rejected at the 0.01 level

    of significance.

    SSE xij

    xi

    j

    nj

    i

    r

    SSTR xi

    x

    i

    r

    MSTRSSTR

    r

    MSESSTR

    n r

    FMSTR

    MSE

    1

    17

    1

    1

    159 9

    1

    159 9

    3 179 95

    17

    82 125

    2 8

    79 95

    2 12537 62

    .

    .

    ( ).

    .

    ( , )

    .

    .. .

    a

    Treatment (i) i j Value (x ij ) (x ij -xi ) (x ij -xi )2

    Triangle 1 1 4 -2 4

    Triangle 1 2 5 -1 1

    Triangle 1 3 7 1 1

    Triangle 1 4 8 2 4

    Square 2 1 10 -1.5 2.25

    Square 2 2 11 -0.5 0.25

    Square 2 3 12 0.5 0.25

    Square 2 4 13 1.5 2.25

    Circle 3 1 1 -1 1

    Circle 3 2 2 0 0

    Circle 3 3 3 1 1

    73 0 17

    Treatment (xi -x) (xi -x)2

    ni (x i -x)2

    Triangle -0.909 0.826281 3.305124

    Square 4.591 21.077281 84.309124

    Circle -4.909 124.098281 72.294843

    159.909091

    29

    Source of

    Variation

    Sum of

    Squares

    Degrees of

    Freedom Mean Square F Ratio

    Treatment SSTR=159.9 (r-1)=2 MSTR=79.95 37.62

    Error SSE=17.0 (n-r)=8 MSE=2.125

    Total SST=176.9 (n-1)=10 MST=17.69

    100

    0.7

    0.6

    0.5

    0.4

    0.3

    0.2

    0.1

    0.0F(2,8)

    f(F

    )

    F Distribution for 2 and 8 Degrees of Freedom

    8.65

    0.01

    Computed test statistic=37.62

    Tabel ANOVA menyimpulkan

    perhitungan-perhitungan.

    Karena satistik uji lebih besar dari nilai

    kritis untuk a=0.01, hipotesis awal

    ditolak, artinya rata-rata triangles,

    squares, dan circles tidak sama.

    30

  • 6Treat Value

    1 41 51 71 82 102 112 122 133 13 23 3

    MTB > Oneway 'Value' 'Treat'.

    One-Way Analysis of Variance

    Analysis of Variance on Value Source DF SS MS F pTreat 2 159.91 79.95 37.63 0.000Error 8 17.00 2.12Total 10 176.91

    The MINITAB output includes not only the ANOVA table and the test statistic,

    but it also gives a p-value corresponding to the calculated F-ratio. In this

    instance the p-value is approximately 0, so the null hypothesis can be rejected

    at any common level of significance.

    31

    The EXCEL output is created by selecting ANOVA: SINGLE FACTOR option

    from the DATA ANALYSIS toolkit. The critical F value is based on a = 0.01.

    The p-value is very small, so again the null hypothesis can be rejected at any

    common level of significance.

    Anova: Single Factor

    SUMMARY

    Groups Count Sum Average Variance

    TRIANGLE 4 24 6 3.333333333

    SQUARE 4 46 11.5 1.666666667

    CIRCLE 3 6 2 1

    ANOVA

    Source of Variation SS df MS F P-value F crit

    Between Groups 159.9090909 2 79.954...