Statistică - Suport de Curs

  • Published on
    26-Dec-2015

  • View
    8

  • Download
    0

Embed Size (px)

DESCRIPTION

1

Transcript

  • 1

    PARTEA I

    STATISTIC DESCRIPTIV

    Curs 1: Scurt istoric

    ntr-o prim concepie, statistica echivala cu descrierea statului, expunerea situaiei

    geografice, economice i politice. Acest gen de statistic a fost cultivat mai nti de italieni. nc

    din sec. XIII - XIV n Republica Veneia se elaborau diferite rapoarte care conineau informaii

    privitoare la partenerii si comerciali i au fost utilizate n politica comercial oficial.

    Curentul "descrierea statului" a atins apogeul n sec. XVII- XVII cnd, n Germania, s-a

    constituit o adevrat coal cunoscut sub denumirea de coala descriptiv german.

    Descrierea statului a devenit disciplin de predare acadamic, ncadrat ntr-un sistem

    construit dup norme teoretice i practice, care s-au elaborat i dezvoltat n universitile germane.

    Noua disciplin (Staatskunde), a primit numele de statistic (Statistik).

    Pe vremea constituirii statisticii ca disciplin descriptiv a statului, se ntea n Anglia, n

    afara universitilor, o statistic cunoscut sub numele de aritmetica politic, a crui scop era:

    analiza datelor de observaie prin procedee matematice, desprinderea regularitilor n fenomenul

    social i chiar formularea de previziuni. Studiile demografice lsau s se ntrevad c previziunea

    fenomenelor colective ar putea avea o nsemntate practic; dealtfel tabelele de mortalitate,

    ntocmite n sec. XVIII au constituit punctul de plecare al nfloritoarei industrii de asigurri.

    Folosirea metodei statistice, recurgerea la instrumentul matematic i cutarea legitilor marcau un

    substanial progres, prefigurnd statistica modern.

    Este dificil s se dea o definiie satisfctoare statisticii. n limbaj uzual termenul este

    folosit pentru a desemna o colecie de numere referitoare la un anumit domeniu (demografie,

    precipitaii, debite). n sens tehnic (mai precis matematic) statistica este un instrument al

    matematicii utilizat pentru prelucrarea i interpretarea informaiilor numerice.

    Scopul statisticii

    Statistica poate fi clasificat n dou mari categorii:

    - statistica descriptiv

    - statistica analitic.

  • 2

    Statistica descriptiv se ocup de prezentarea, clasificarea i sintetizarea datelor de

    observaie. Aceasta concentreaz informaia existent n datele respective cu ajutorul anumitor

    indicatori statistici care, n fond, sunt nite numere ce exprim caracteristici sau tendine ale

    fenomenului studiat.

    Statistica analitic folosete metode matematice (teoria probabilitilor) pentru extragerea

    i prelucrea informaiei statistice; n multe cazuri aceste metode pun n eviden legiti statistice.

    Depirea stadiului descriptiv, al simplei metode cantitative, a nsemnat, istoric vorbind,

    deplasarea gndirii statistice spre interpretarea analitic a fenomenului i obinerea de concluzii

    inductive, pe baza observaiilor empirice. Aceast schimbare de coninut a fcut ca statistica s se

    ntreptrund n mod constant cu matematica, n cutarea de metode corespunztoare obiectivelor

    sale.

    Transpus ntr-un limbaj matematic statistica s-a construit ntr-o teorie numit teoria

    corelaiei statistice, ale crei aplicaii au permis identificarea unor noi legi de dependen, specific

    statistice i adaptate la formele complexe i variate pe care le ofer natura n diferitele sale

    manifestri.

    n cercetrile moderne se pornete de la ipoteze statistice asupra fenomenului sau procesului

    observat, consecinele lor logic deduse se compar apoi cu datele disponibile i dac sunt n

    concordan, ipotezele sunt justificate, cel puin pn la noi observaii mai riguroase.

    Unul din obiectivele eseniale ale statisticii se consider tocmai msurarea incertitudinii

    concluziilor inductive. De la un timp ns, gndirea statistic tinde s se preocupe mai puin de

    msurarea incertitudinii i mai mult de determinarea riscului de eroare i a pierderilor implicate de

    orice decizie ntemeiat pe o informaie care, prin natura sa, nu poate fi exhaustiv.

    Aplicarea calculelor statistice la datele empirice, oferite de observare a fenomenului,

    permite desprinderea de legiti statistice.

    Fenomenele sunt n interconexiune unele cu altele, n sensul c se genereaz i se

    influeneaz reciproc. Acest fapt conduce la noiunea de cauzalitate care exprim interaciunea

    dintre cauz i efect astfel nct ntotdeauna cauza s precead efectul. Desfurarea fenomenelor

    const astfel ntr-un ir nentrerupt de momente, ntr-o succesiune cauz-efect, efectul fiind la

    rndul lui cauz pentru un alt efect .a.m.d. Astfel se formeaz un lan cauzal. Orice ntrerupere a

    lanului cauzal nseamn de fapt existena unui efect care s nu aib cauz. Nici un fenomen nu se

    abate de la acest principiu care poart numele de principiul cauzalitii. Cunoaterea desfurrii

  • 3

    evenimentelor este asigurat de cunoaterea legilor care guverneaz fenomenul i a ansamblului de

    condiii n care se desfoar acesta. Deci legea este un element primordial n cunoaterea

    fenomenelor deoarece exprim raporturile eseniale, necesare, generale, relativ stabile i repetabile

    ale fenomenelor i ale desfurrii lor. Putem deosebi dou mari categorii de legi:

    - legi fizice, care se aplic fenomenelor i proceselor individuale luate n parte (ex. legea

    atraciei universale, legile I, II, III ale dinamicii etc.) i

    - legi statistice, care se aplic numai fenomenelor de mas, ansamblurilor de obiecte (ex.

    legea gazelor perfecte, legea dezintegrrii radioactive, etc.) i care exprim anumite caracteristici

    ale ansamblului considerat.

    Legile fizice permit cunoaterea perfect a desfurrii viitoare a fenomenelor pe baza

    cunoaterii la momentul iniial a unor mrimi. Astfel, n mecanic, legea a II-a a lui Newton

    permite cunoaterea perfect a micrii unui obiect atunci cnd se cunosc la momentul iniial

    poziia (trei coordonate) i viteza sau impulsul (trei proiecii) obiectului.

    Legile statistice permit cunoaterea desfurrii viitoare a fenomenelor doar n termeni

    probabilistici (probabiliti, valori medii, erori statistice etc.). Acest lucru indic de la nceput c

    informaia pe care o d o lege statistic este mai srac dect cea dat de legea dinamic. Cu toate

    acestea, legea statistic permite cunoaterea desfurrii viitoare a fenomenelor i poate fi tot att

    de determinist ca i cea dinamic.

    Particularitatea esenial a legilor statistice izvort din faptul c ele acioneaz n

    fenomenele de mas, unde ntregul este determinat de unitatea prilor componente, o constituie

    exprimarea comportrii ansamblului de uniti omogene i nu a fiecrei uniti n parte. n mod

    corespunztor, legea statistic se realizeaz ca o tendin predominant, ca o necesitate care i

    croiete drum printr-un numr foarte mare de contingene i care se manifest n aceste contingene

    ca media unui numr mare de abateri ntmpltoare. De aici i principiul verificat deseori n

    practic: legea statistic poate fi evideniat dac i numai dac este considerat i supus observrii

    un numr mare sau suficient de mare de uniti elementare ale ansamblului considerat.

  • 4

    Noiuni elementare

    Investigarea statistic presupune, prin definiie, considerarea fenomenelor n multiplicitatea

    i variabilitatea lor. Un ansamblu de fenomene formeaz un fenomen de mas, sau, ceea ce numim

    populaie statistic, n msura n care elementele componente (indivizi) sunt de aceai natur, adic

    au toate o proprietate comun i se deosebesc unele de altele n raport cu aspectele sau valorile

    caracteristice luate n studiu. Populaia cu care lucreaz statistica trebuie s fie global omogen - s

    includ doar elementele similare, aparinnd de aceeai "categorie" i intern structurat -

    elementele ei s poat fi ordonate potrivit unui sistem de clasificare.

    Aa cum rezult din cele de mai sus, o nsuire specific statisticii este aceea c statistica nu

    se ocup cu un element (individ) luat ca atare, ci cu colectiviti, cu grupuri de elemente ce posed

    o anumit trstur comun. Aceast trstur se numete caracteristic. Denumirea de "populaie"

    s-a pstrat din timpurile n care statistica se ocupa cu precdere de populaii n sensul propriu al

    cuvntului. O populaie poate fi mpit n subpopulaii sau populaii pariale, care sunt: clase,

    grupe i eantioane.

    O clas este un subansamblu de elemente ale unei populaii care conin o variabli

    determinat de aceeai msur.

    Un grup este un subansamblu de elemente ale unei populaii care se distinge printr-o

    manier de tratare comun.

    Un eantion este un subansamblu de elemente ale unei populaii ales la ntmplare. Se

    apeleaz la acest gen de populaie parial atunci cnd populaia n studiu este prea mare pentru a fi

    tratat n ansamblul ei. Studiul asupra eantionului va fi atribuit ntregii populaii.

    Indivizii unei populaii statistice sunt cercetai pentru una sau mai multe caracteristici.

    Caracteristicile ntlnite se clasific n caracteristici cantitative i calitative. Caracteristicile

    cantitative sunt cele care se a cror msur au o exprimare numeric (nlime, greutate, lungimea

    unui ru etc.) i se mai numesc variabile statistice. Caracteristicile calitative nu se msoar numeric

    (culoare, sexul unei persoane etc.). Ele nu reprezint o msur a unei entiti. Dac se convine s se

    reprezinte unele din ele prin numere ataate la categoriile ce le determin, nu este vorba dect de o

    "codificare", procedeul nejustificnd operaiile aritmetice. Aceste caracteristici se mai numesc

    atribute.

    La rndul lor, caracteristicile cantitative pot fi discrete sau continue. Variabilele discrete

    sunt cele care pot lua un numr finit (sau cel mult numrabil) de valori distincte (ntregi,

  • 5

    fracionare), cum ar fi numrul membrilor unei familii, nr. de staii hidrologice etc. Variabilele

    continue sunt cele care pot lua orice valoare dintr-un anumit interval (nlimea unui individ,

    nivelul unui ru etc.). Totui, n practic nu se ntlnete o informaie privind adncimea unui ru

    de forma: 1m, 3 cm, 17 microni. Acest lucru nu se va ntmpla fie c precizia aparatelor cu care

    efectum msurtorile este limitat, fie c o precizie exagerat nu este ntotdeauna folositoare

    pentru ceea ce urmrim n investigaie. Astfel, msurtorile sau datele de observaie se grupeaz n

    cadrul unei anumite uniti i deci din punct de vedere practic se lucreaz cu forma discret chiar

    dac variabilele sunt de tip continuu. Distincia ntre caracterul cantitativ i cel calitativ, precum i

    ntre variabilele discrete i variabilele continue este fundamental deoarece ele recurg la tehnici de

    analiz foarte diferite.

    Aici trebuie s lmurim un lucru care d deseori natere la confuzii: muli sunt nclinai s

    cread c variabilele discrete trebuie s ia numai valori ntregi i c numerele fracionare sunt tipice

    pentru variabilele continue; cu alte cuvinte diferena dintre continuu i discret se confund cu

    diferena dintre msurtorile cu numere ntregi i cele fracionare. S lum exemplul urmtor: o

    variabil ia valorile: 1,041; 1,065; 1,077. Aceasta este o variabil discret deoarece trecerea de la o

    valoare la alta se face fr vreo alt valoare intermediar.

    Cercetarea statistic a unei colectiviti poate fi:

    -exhaustiv (total), cnd fiecare individ este analizat, de exemplu n cazul recensmintelor;

    -parial (selectiv), cnd sunt examinai numai anumii indivizi, alei aleator. Ea este cea

    mai frecvent folosit, n majoritatea cazurilor fiind i singura posibil.

    Partea examinat din colectivitate se numete selecie sau eantion. Numrul indivizilor

    examinai se numete volumul seleciei.

  • 6

    Curs 2: Analiza seriilor statistice

    Evaluarea anumitor indicatori (parametri) statistici implic stabilirea caracteristicilor

    (proprietilor) principale ale seriilor statistice. Acestea sunt: variabilitatea, omogenitatea,

    independena i concentrarea/mprtierea (dispersia) ctre/fa de un una sau mai multe valori ale

    seriei.

    Variabilitatea termenilor unei serii statistice este determinat de faptul c fenomenul pe

    care l reprezint nu este univoc determinat, ci apare ca un rezultat al aciunii combinate a mai

    multor cauze (permanente sau ntmpltoare). Cu ct aciunea cauzelor ntmpltoare este mai

    mare, cu att variabilitatea este mai mare i gradul de omogenitate mai mic.

    Omogenitatea presupune o variaie minim ntre termeni. Dac n urma analizei se constat

    c o serie nu prezint omogenitate, nseamn c n acest caz colectivitatea este format din mai

    multe tipuri calitative i seria trebuie descompus n subserii componente.

    Independena termenilor unei serii provine din faptul c fiecare valoare individual

    reprezint un element distinct i obiectiv al unei populaii statistice. Termenii ce aparin aceleiai

    colectiviti se supun acelorai legi care se manifest sub form de tendin.

    Concentrarea/mprtierea (dispersia) ctre/fa de un una sau mai multe valori ale seriei

    apare ca rezultat al intensitii unui efect produs de cauze eseniale i ntmpltoare. Acest lucru

    determin frecvenele diferite de apariie a diferitelor valori din serie. Dac intensitatea factorilor

    este uniform, frecvenele de apariie sunt apropiate. n caz contrar, frecvenele de apariie se

    concentreaz fie la un singur capt al seriei, fie ctre o valoare central.

    Repartiii de frecvene

    Exist diferene ntre analiza seriilor dinamice i problemele legate de gruparea i analizarea

    materialelor pentru care factorul timp nu are importan. La cercetarea seriilor dinamice problema

    de baz o reprezint analiza variabilei timp.

    Metodele de analiz folosite n aceste dou cazuri se deosebesc sensibil. n cele ce urmeaz

    ne vom ocupa de problemele gruprii i analizei prealabile a datelor numerice pentru care ordinea

    de aezare n timp nu conteaz.

    Datele statistice n stare brut reprezint o mas dezordonat de materiale. Prima problem

    este aceea de a face o asemenea grupare a datelor cu ajutorul creia s se poat aprecia valoarea lor

    n legtur cu problema propus, s se poat nlesni comparaia cu alte date de acelai gen i s se

  • 7

    poat obine posibilitatea unei analize ulterioare. nainte ca materialul statistic s fie supus analizei

    ulterioare i generalizrilor care vor permite s se fac anumite deducii, el trebuie s capete o

    anumit form i o structur clar. Cu alte cuvinte n cadrul analizei datelor statistice trebuie s se

    ia n considerare att valorile individuale ct i frecvenele de apariie ale acestora.

    n urma observrii caracteristicii cantitative X n n probe se obin urmtoarele date primare:

    x1, x2,..., xn (1)

    n cazul n care volumul seleciei este mic aceste date sunt uor de manipulat i nu este nevoie de o

    grupare a lor. Dac ns avem o selecie de volum mare este greu de lucrat cu aceste date. n plus

    tabelele de date primare nu sugereaz nimic referitor la referitor la repartiia variabilei X. De aceea

    este nevoie de o grupare (centralizare) a datelor.

    Gruparea datelor se face n funcie de tipul caracteristicii X. Astfel, dac X este o variabil

    discret ce poate lua valorile distincte v1, v2 ,..., vn , atunci n locul datelor iniiale se va reine

    repartiia empiric:

    m

    m

    nnn

    vvv

    ....

    ....

    21

    21 (2)

    Unde ni, (i=1, m) reprezint frecvena apariiei (numrul de apariii) valorii vi, iar n reprezint

    numrul valorilor din irul iniial (1) i se numete frecven absolut a valorii v. Valoare m

    reprezint numrul de clase.

    Raportul fj =nj/n dintre frecvena absolut i numrul total de probe se numete frecven

    relativ. Se observ c

    f1 + f2 ++ fm =1 ntruct n1 +n2 + ... +nm =...