Suport de curs Statistică

  • Published on
    28-Jan-2017

  • View
    217

  • Download
    2

Embed Size (px)

Transcript

  • CURS STATISTIC - Unitatea de nvare nr. 6

    ANALIZA STATISTIC A DISTRIBUIILOR DE FRECVENE.

    INDICATORII TENDINEI CENTRALE (2).

    Cuprins:

    1.Obiectivele unitii de nvare.

    2.Indicatorii medii de poziie.

    2.1 Mediana

    2.2. Modul

    3.Abordri comparative ntre principalii indicatori ai tendinei centrale.

    4. Rspunsuri i comentarii la testele de autoevaluare.

    5. Teme de control.

    6. Rezumatul unitii de nvare.

    7. Bibliografia unitii de nvare.

    1. Obiectivele unitii de nvare

    n urma parcurgerii acestei uniti de nvare studentul:

    va nelege cnd este indicat s se utilizeze mediana i modul

    i va nsui metodologia de calcul a celor doi indicatori (mediana i modul) pentru toate

    tipurile de serii

    2. Indicatorii medii de pozitie

    Indicatorii medii de poziie evideniaz tendinele de mijloc sau de concentrare a unitilor.

    Dintre indicatorii medii de poziie, cei mai frecveni utilizai sunt: mediana i modul.

  • 2.1. Mediana

    Mediana face parte din categoria cuantilelor alturi de quartile, decile. Cuvntul median

    provine din cuvntul latin medius care nseamn mijloc.

    Mediana reprezint acea valoare a unei serii ordonate cresctor sau descresctor care

    mparte seria n dou pri egale, aa nct 50% din termenii seriei au valori mai mici dect

    mediana, iar 50% mai mari dect mediana.

    Un avantaj al medianei fa de medie este acela c poate fi utilizat n caracterizarea

    tendinei centrale pentru o serie de date msurate pe o scar ordinal. Mediana ia n consideraie

    doar poziia termenilor n serie, nu i mrimea acestor valori, deci mediana nu este supus

    influenei valorilor foarte mari sau foarte mici care sunt lsate n afara seriei.

    Exemplul 1 Pentru 10 obolani care ncearc s ias dintr-un labirint se cunosc urmtorii timpi de parcurgere:

    9 obolani au parcurs labirintul n mai puin de 15 minute, n timp ce un obolan a reuit s

    parcurg labirintul dup 24 de ore. Pentru a calcula timpul mediu n care un obolan parcurge

    labirintul valoarea reprezentativ este mediana i nu media (care ar fi afectat de acea durat

    mare de peste 24 ore).

    Valoarea medianei este invariabil fa de convenia cu care se nchid intervalele extreme,

    spre deosebire de medie care este influenat att de valori ct i de frecvena lor.

    Dac seria prezint o repartiie normal atunci mediana poate s nlocuiasc valoarea

    medie deoarece se calculeaz mai uor.

    Mediana este un indicator utilizat n cercetrile medicale, n studiul mortalitii, la

    determinarea duratei medii de via, la determinarea duratei medii de funcionare a unui produs.

    Calculul medianei:

    pentru o serie simpl (pentru date negrupate), ntlnim dou situaii:

    - seria are un numr impar de termeni atunci mediana este egal cu termenul central

    al seriei ordonate cresctor sau descresctor.

    Se cunoate urmtorul set de valori ale unei caracteristici:

    5 7 4 9 12 3 10

    Ordonm seria cresctor:

  • 3 4 5 7 9 10 12

    Me

    Pentru date ordinale mediana este varianta situat n centrul seriei.

    - seria are un numr par de termeni, atunci mediana este egal cu media aritmetic

    simpl a celor 2 termeni centrali ai seriei ordonate cresctor sau descresctor.

    Fie urmtorul set de valori:

    3 1 5 7 9 4

    1 3 4 5 7 9

    5,42

    54Me

    Pentru un ir de date ordinale format din numr par de termeni, mediana este egal cu una

    din cele dou variante din centrul seriei dac aceste variante sunt egale, iar dac variantele nu

    sunt egale mediana ia 2 valori deoarece nu se poate face media lor.

    pentru o serie de distribuie de frecvene pe variante calculul medianei comport

    urmtoarele etape:

    Etapa 1: se determin locul medianei n cadrul seriei:

    1n2

    1L

    k

    1iiMe

    Etapa 2: se cumuleaz cresctor frecvenele absolute i se determin acea frecven

    cumulat cresctor care este imediat mai mare sau egal cu locul medianei (LMe). Varianta care

    corespunde frecvenei absolute cumulate ce ndeplinete condiia de mai sus este mediana.

    Exemplul 2 80 de apartamente dintr-un bloc au fost sistematizate dup numrul de camere rezultnd

    urmtoarea distribuie de frecvene:

    Nr. Camere (xi) Nr. Apartamente (ni) ni cumulat cresctor

    1

    2

    3

    4

    13

    25

    28

    14

    13

    38

    66

    30

  • Total 80

    Calculai mediana.

    665,40812

    11n

    2

    1L

    k

    1iiMe

    Me = 3 camere 50% dintre apartamente au mai puin de 3 camere, iar 50% mai mult

    de 3 camere.

    pentru o serie de frecvene pe intervale de variaie, mediana se poate determina

    numai n ipoteza n care valorile sunt distribuite uniform n cadrul intervalului de

    grupare.

    Etape:

    - se determin locul medianei n cadrul seriei:

    1n2

    1L

    k

    1iiMe

    - se cumuleaz cresctor frecvenele absolute i se determin acea frecven cumulat

    cresctor care este imediat mai mare sau egal cu Lme. Intervalul care corespunde frecvenei

    absolute cumulate ce ndeplinete condiia de mai sus este intervalul median.

    - se calculeaz mediana cu relaia:

    Me

    pMeMe0

    n

    nLhxMe

    x0 = limita inferioar a intervalului median;

    h = mrimea intervalului median;

    npMe = suma frecvenelor absolute pn la intervalul median;

    nMe = frecvena absolut a intervalului median.

    Exemplul 3 Repartiia sucursalelor unei bnci comerciale n funcie de volumul depozitelor bancare atrase

    ntr-o lun este:

    Volum depozite bancare

    (mii euro) (xi) Nr. Bnci (ni) ni cumulat cresctor

  • 20 40

    40 60

    60 80

    80 100

    100 - 120

    12

    14

    20

    18

    16

    12

    26

    46

    64

    80

    Total 80 -

    80,60Me465,402

    811n

    2

    1L

    5

    1iiMe

    euro mii5,7420

    265,402060Me

    Deci 50% dintre sucursale au atras depozite n valoare de 74,5 mii euro, iar 50% peste 74,5

    mii euro.

    Calculul grafic al medianei se poate realiza n dou moduri:

    mediana este corespondenta pe abscis a punctului de intersecie al ogivei cresctoare

    cu ogiva descresctoare;

    se traseaz doar ogiva cresctoare, iar de pe axa OY din punctul corespunztor locului

    medianei se duce o paralel cu axa OX ce intersecteaz ogiva cresctoare ntr-un punct.

    Corespondenta pe abscis a acestui punct este mediana.

    Dezavantajele medianei:

    mediana este mai puin stabil dect media;

    nu poate fi supus cu aa uurin calculelor algebrice;

    media este preferat n statistica inferenial.

    2.2. Modul

    Modul (dominanta unei serii) este valoarea cea mai des ntlnit sau creia i corespunde

    cea mai mare frecven de apariie.

    Calculul algebric al modului:

    - pentru o serie simpl:

    Exemplul 4

  • La un magazin de pantofi s-au vndut ntr-o or pantofi avnd urmtoarele mrimi:

    Caz 1: 35 37 39 40 42

    Aceast serie nu are mod.

    Caz 2: 35 37 35 40 42

    Mo = 35 deoarece este valoarea cea mai des ntlnit

    Caz 3: 35 37 35 40 40

    Mo1 = 35 Mo2 = 40

    Aceast serie este bimodal.

    Exist i serii plurimodale.

    - pentru o serie de distribuie pe variante, modul este egal cu varianta creia i

    corespunde frecvena absolut sau relativ maxim.

    Exemplu 5 Nr. camere (xi) Nr. apartamente(ni)

    1

    2

    3

    4

    13

    25

    28

    14

    Mo = 3 camere deoarece variantei 3 i corespunde frecvena absolut maxim.

    - pentru o serie de distribuie de frecvene pe intervale de variaie modul se calculeaz

    cu relaia:

    21

    10 hxMo

    x0 = limita inferioar a intervalului modal;

    h = mrimea intervalului modal;

    1 = diferena dintre frecvena intervalului modal i a celui anterior;

    2 = diferena dintre frecvena intervalului modal i a celui urmtor.

    Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim.

    Exemplul 6 Volum depozite bancare (mii euro) (xi) Nr. Bnci (ni)

    20 40

    40 60

    60 80

    80 100

    100 - 120

    12

    14

    20

    18

    16

  • Intervalul modal este [60, 80)

    7526

    62060

    )1820()1420(

    14202060Mo

    mii euro

    Cele mai multe bnci au atras depozite n valoare de 75 mii euro.

    Testul de autoevaluare 1

    1. Un auditor bancar a selectat 10 conturi i a nregistrat sumele existente n fiecare dintre

    aceste conturi. Sumele sunt date n Euro: 150,175, 195, 200,235,240,250,256,275,294

    Se cere: s se calculeze mediana i modul.

    2.Distribuia salariailor unui magazin n funcie de numrul de zile de concediu de odihn

    dintr-un an se prezint astfel:

    Zile concediu 14 15 16 17 18 19 20

    Nr. salariai 2 6 10 15 8 5 4

    Se cere : s se calculeze mediana i modul.

    3.Un studiu efectuat asupra unui numr de 50 de cutii de brnz topit la cutie dintr-un

    magazin a reliefat urmtoarele informaii cu privire la numrul de calorii coninute:

    Calorii 75-85 85-95 95-105 105-115 115-125

    Nr. cutii cu

    brnz topit 5 10 15 14 6

    Se cere s se calculeze indicatorii tendinei centrale

    Calculul grafic al modului:

    n cazul seriilor de distribuie pe variante, determinarea grafic a modului se face cu

    ajutorul diagramei prin bare sau prin bastoane, modul fiind acea valoare de pe abscis

    creia i corespunde ordonata maxim:

  • n cazul seriilor de distribuie pe intervale de variaie, determinarea grafic a

    modului se face cu ajutorul histogramei. Se determin punctul de intersecie al

    segmentului ce unete captul din stnga al blocului cel mai nalt cu captul din stnga

    blocului urmtor cu segmentul ce unete captul din dreapta al blocului cel mai nalt cu

    captul din dreapta al blocului anterior. Corespondena pe abscis a acestui punct de

    intersecie este modul.

    Analog cu modul se poate determina, n cazul distribuiilor n form de U i valoarea

    antimodal creia i corespunde frecvena minim.

    Modul nu este un indicator al tendinei centrale foarte stabil i poate fi afectat de modul n

    care au fost construite intervalele de variaie. n plus, modul nu se preteaz aa uor la clacule

    algebrice ca i mediana.

    Cu toate aceste dezavantaje, modul este un indicator util n analiza seriilor de dimensiuni

    mari n care ne intereseaz valoarea cea mai des ntlnit.

    3. Abordarea comparativ a principalilor indicatori ai tendinei centrale

    Media este indicatorul cel mai utilizat n analiza tendinei centrale. Calculul mediei se

    bazeaz pe ansamblul valorilor caracteristicii xi, de aceea ea este influenat de valorile extreme.

    Mo

    xi ni

    Mo

    xi

    ni

  • Mediana este un indicator care, spre deosebire de medie, se calculeaz n funcie de poziia

    termenilor n serie i nu este influenat de valorile termenilor.

    Modul se determin foarte uor, dar este indicatorul cel mai sensibil la modul de grupare a

    datelor. Dou grupri diferite ale aceleiai serii vor conduce la dou valori modale diferite.

    Pentru o serie perfect simetric cei trei indicatori ai tendinei centrale sunt egali:

    MoMex

    Proprieti

    (Yule Kendall) Modul Mediana Media aritmetic

    Este definit ntr-un mod obiectiv da da da

    Depinde de numrul de termeni ai

    seriei nu da da

    Este puin sensibil la mrimea

    valorilor extreme da da nu

    Are o semnificaie concret da da da

    Este uor de calculat da da da i nu

    Este puin sensibil la eantionare destul nu da

    Se preteaz la calcule algebrice nu nu da

    4. Rspunsuri i comentarii la testele de autoevaluare

    1.Mediana

    Pentru calculul medianei valorile xi trebuie ordonate cresctor. (sunt, din ipotez)

    Seria are numr par de termeni (10 termeni), deci mediana este media aritmetic a celor doi

    termeni centrali:

    Euro5,2372

    240235Me

    Deci, n 50% din conturi sunt mai puin de 237,5 Euro, iar n 50% din conturi sunt peste

    237,5 Euro.

    Modul este valoarea cea mai des ntlnit. Fiind serie simpl i neavnd date care s se

    repete, seria nu are mod.

  • 2.

    Mediana (valoarea central a seriei)

    zile17Me335,25512

    1)1n(

    2

    1:L

    7

    1iiMe

    Se cumuleaz cresctor frecvenele absolute (ni):

    xi ni ni cumulate cresctor

    14

    15

    16

    17

    18

    19

    20

    2

    6

    10

    15

    8

    5

    4

    2

    8

    18

    33

    41

    46

    50

    Deci 50% dintre salariai au avut sub 17 zile concediu, iar 50%, peste 17 zile.

    Modul (dominanta unei serii)

    Modul este, n cazul gruprii pe variante, acea valoare a caracteristicii creia i corespunde

    frecvena absolut maxim. Frecvena absolut (ni) maxim este 15 Mo = 17 zile. Cei mai

    muli salariai au avut 17 zile de concediu.

    3.Indicatorii tendinei centrale sunt:

    a1) Media se calculeaz ca o medie aritmetic ponderat

    xi reprezint centrul de interval calculat ca medie aritmetic simpl ntre limita inferioar i

    limita superioar a fiecrui interval:

    calorii 2,10150

    5060

    50

    612014110151001090580

    n

    nx

    x5

    1ii

    5

    1iii

    a2) Mediana (valoarea central a seriei):

    105,95Me305,25512

    1)1n(

    2

    1:L

    5

    1iiMe

    Se cumuleaz frecvenele absolute i se determin care frecven absolut este imediat mai

    mare sau egal cu LMe. Intervalul care corespunde frecvenei absolute cumulate ce ndeplinete

  • condiia de mai sus este intervalul median.

    Me se calculeaz cu relaia:

    calorii10215

    155,251095

    n

    nLhxMe

    Me

    pMeMe0

    x0 = limita inferioar a intervalului median;

    h = mrimea intervalului;

    npMe = suma frecvenelor absolute pn la intervalul median;

    nMe = frecvena absolut a intervalului median.

    Deoarece Me = 102 calorii 50% din cutii au sub 102 calorii, iar 50% au peste 102

    calorii.

    a3) Modul (dominanta seriei):

    calorii33,103)1415()1015(

    10151095hxMo

    21

    10

    x0 = limita inferioar a intervalului modal;

    h = mrimea intervalului modal;

    1 = diferena dintre frecvena absolut a intervalului modal i frecvena absolut a

    intervalului anterior celui modal;

    2 = diferena dintre frecvena absolut a intervalului modal i frecvena absolut a

    intervalului urmtor celui modal.

    Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim. Deci Mo

    [95, 105].

    Deoarece Mo = 103,33 calorii, rezult c cele mai multe dintre cutii au 103,33 calorii.

    5. Teme de control

    1.Se cunosc urmtoarele date privind numrul de cri mprumutate n decursul unei luni de

    abonaii unei biblioteci:

    Nr. cri mprumutate 0 1 2 3 4 5 6 7

    Nr. abonai 18 39 57 64 42 33 21 4

    Calculai mediana acestei serii.

  • 2. Calculai mediana pentru seria statistic urmtoare:

    14 16 12 9 11 18 7 8 9 16 7 9 18

    3.Un studiu privind durata de via n ore a unui produs electrocasnic efectuat pe 100 aparate a

    condus la urmtoarele rezultate:

    Durata de via (ore) Structura numrului de aparate electrocasnice

    0 1000

    1000 2000

    2000 3000

    3000 4000

    4000 5000

    5000 - 6000

    8

    20

    26

    22

    18

    6

    Total 100

    Se cere: s se calculeze indicatorii tendinei centrale;

    6. Rezumatul Unitii de nvare

    Indicatorii tendinei centrale reprezint o categorie deosebit de important de indicatori statistici

    utilizai n analiza variabilelor numerice. Aceti indicatori sintetici redau ntr-o singur msur ceea ce

    este tipic, esenial, caracteristic, obiectiv i stabil pentru o serie de date numerice.

    Indicatorii tendinei centrale sunt:

    mrimile medii care pot fi calculate att ca medii simple (pentru date negrupate), ct i ca medii ponderate (pentru date grupate pe variante sau pe intervale)

    - media aritmetic - media geometric - media ptratic - media armonic

    indicatorii medii de poziie - mediana - modul

    Aceti indicatori caracterizeaz cu att mai bine tendina central cu ct datele pe baza crora

    se determin sunt mai omogene.

    Cei mai importani i mai utilizai indicatori ai tendinei centrale sunt: media, mediana, modul.

    7. Bibliografia Unitii de nvare

    1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004

    2. Danciu A.,Niculescu I., Gruiescu M., Statistic economic, Editura Enciclopedic, Bucureti,

    2009

  • 3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistic, Editura Universitar, Bucureti, 2003;

    4. Voineagu V., ian E., Ghi S., Boboc C., Todose D. Statistic. Baze teoretice i aplicaii,

    Editura Economic, Bucureti, 2007;

    5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995