Statistiques1 Licence STE 2eme année. Statistiques2 1.Introduction 2.Coefficient de corrélation Principe Interprétation 3.Modèles de régression Régression

  • Published on
    03-Apr-2015

  • View
    106

  • Download
    3

Embed Size (px)

Transcript

<ul><li> Page 1 </li> <li> Statistiques1 Licence STE 2eme anne </li> <li> Page 2 </li> <li> Statistiques2 1.Introduction 2.Coefficient de corrlation Principe Interprtation 3.Modles de rgression Rgression linaire Ajustement par un polynme Fonction exponentielle Le cofficient de dtermination 4.Approche non-paramtrique Coefficient de correlation de Spearman Plan </li> <li> Page 3 </li> <li> Statistiques3 Mthode et but 2 variables numriques (quantitatives) Identifier la nature des variables : indpendante x et dpendante y. Dcrire la relation entre les variables graphiquement en utilisant une quation Utiliser lquation pour prvoir une valeur y i partir dune valeur x i. Etablir le degr de fiabilit de lestimation (relation probabiliste seulement) La relation entre deux variables peut tre : dterministe (Ceci ne nous concerne pas ici) probabiliste (Cest ce dont on va parler) 1. Introduction </li> <li> Page 4 </li> <li> Statistiques4 y x Relation dterministe: La valeur de la variable y peut tre prcisement prdite partir de la valeur de la variable x. Exemples: Prix dune maison et taxe due. Vitesse dun corps en chute libre et temps. V=V 0 +gt V t V0V0 1. Introduction </li> <li> Page 5 </li> <li> Statistiques5 y x Relation probabiliste: La valeur dune variable y ne peut pas tre prcisement prdite partir de la valeur de la variable x - cause dautres facteurs. Exemples: x y 1. Consommation en eau et une population x = nombre dhabitants y = eau consomme x y 2. Nombre dheures passes rviser un examen et la note obtenue. x = heures passes rviser y = note obtenue Regression possible avec une relation probabiliste. 1. Introduction </li> <li> Page 6 </li> <li> Statistiques6 Le coefficient de corrlation est une mesure du degr de corrlation linaire. En pratique on essaye dobtenir une estimation (r) partir dun chantillon reprsentatif de la population. Approche gomtrique: Q1 Q3 Q2 Q4 2. Coefficient de correlation </li> <li> Page 7 </li> <li> Statistiques7 videmment cette somme dpend de n. On va donc diviser par (n-1). Au fait, pourquoi (n-1) et pas simplement n??? Cov(x,y) est la covariance. Elle est utilise dans de nombreuses mthodes multivaries. Il y a encore un problme La covariance dpend fortement des units de x et de y. Alors que faire...? est un paramtre intressant 2. Coefficient de correlation </li> <li> Page 8 </li> <li> Statistiques8 Pour viter ce problme on va diviser la covariance par lcart type de x et lcart type de y. Attention : les donnes doivent tre normalement distribue (mais nous reviendrons sur ce point) Coefficient de corrlation de Bravais-Pearson Un exemple... 2. Coefficient de correlation </li> <li> Page 9 </li> <li> Statistiques9 2. Coefficient de correlation </li> <li> Page 10 </li> <li> Statistiques10 r = 0,987 2. Coefficient de correlation </li> <li> Page 11 </li> <li> Statistiques11 Allons un peu plus loin... Ingalit de Schwarz: Donc... r = 1 r = -1 r = 0.7 r 0 Liaisons absolues (dterministe) Liaison stochastique (probabiliste) Pas de liaison 2. Coefficient de correlation </li> <li> Page 12 </li> <li> Statistiques12 Un exemple: Teneurs en Be, Zn et Sr (ppm) dans ltang de Thau Etude des variables deux deux 2. Coefficient de correlation </li> <li> Page 13 </li> <li> Statistiques13 La matrice de corrlation... Reprsentation pratique pour lexploration 2. Coefficient de correlation </li> <li> Page 14 </li> <li> Statistiques14 2. Coefficient de correlation </li> <li> Page 15 </li> <li> Statistiques15 En pratique attention!!!!!! Ce coefficient de corrlation doit tre mani avec grande prcaution r = 0.93 r = 0 r donne le degr de liaison linaire. Dpendance curvilinaire forte et r faible dans le 2eme cas. Le diagramme xy doit donc toujours tre examin en mme temps que la valeur de r. 2. Coefficient de correlation </li> <li> Page 16 </li> <li> Statistiques16 r = -0.13r = 0.19 r = 0.53r = 0.92 Le coefficient de corrlation peut produire de hautes valeurs si des points isols sont prsents. 2. Coefficient de correlation </li> <li> Page 17 </li> <li> Statistiques17 La corrlation de deux variables log-transformes doit toujours tre interprte avec prcaution r = 0.355 100 50 0 306090 Zn Pb r = 0.784 4.8 3.0 1.2 2.03.05.0 ln(Zn) ln(Pb) 4.0 2. Coefficient de correlation </li> <li> Page 18 </li> <li> Statistiques18 Les coefficients de corrlation pour des donnes fermes (i.e. %) sont probablement biaiss!!! r = -1 100 50 0 Qz (%) Fldp (%) Pourquoi? La valeur dune variable aura tendance affecter les autres. 100 50 r = - 0.62 100 50 0 Qz (%) Fldp (%) 100 50 Roche igne avec un 3ieme composant </li> <li> 04/11/2013Statistiques65 Deux cas possibles Si n r )= On rejette donc H 0 si Ir s I&gt;r Ici, n=17, r s =0,91&gt;0,5, donc H 0 est rejet, il y a donc une corrlation significative entre Zr et Be au sens de Spearman 3. Corrlations non-paramtriques r s de Spearman (petits chantillons) Cette valeur est-elle significative? (absence de corrlation) n (nbre de paires)0.050.020.01 50.950,99 60.8860.9431 70.7860.8930.929 80.7380.8330.881 90.6830.7830.833 100.6480.7460.794 120.5910.7120.777 140.5440.6450.715 160.5060.6010.665 180.4750.5640.625 200.450.5340.591 </li> <li> Page 66 </li> <li> 04/11/2013Statistiques66 3. Corrlations non-paramtriques r s de Spearman (grands chantillons) Si n&gt;20, on opre de la mme faon que pour le coefficient de corrlation linaire : </li> <li> Page 67 </li> <li> 04/11/2013Statistiques67 3. Corrlations non-paramtriques r s de Spearman ATTENTION : Un r s significatif signifie que les variables sont lies sans savoir de quelle faon!!! Voyons cela sur quelques exemples </li> <li> Page 68 </li> <li> 04/11/2013Statistiques68 r s =1 3. Corrlations non-paramtriques r s de Spearman </li> <li> Page 69 </li> <li> 04/11/2013Statistiques69 r = 0.88 3. Corrlations non-paramtriques r s de Spearman </li> <li> Page 70 </li> <li> 04/11/2013Statistiques70 r de Pearson Fort Faible Fort r s de Spearman 3. Corrlations non-paramtriques r s de Spearman </li> </ul>