STATISTIQUES DESCRIPTIVES BIVARIÉES - ?· L1 Psycho Statistiques descriptives STATISTIQUES DESCRIPTIVES…

  • Published on
    11-Sep-2018

  • View
    216

  • Download
    4

Embed Size (px)

Transcript

<ul><li><p>L1 Psycho Statistiques descriptives</p><p>STATISTIQUES DESCRIPTIVESBIVARIES</p><p>Exercice 1. Un site internet reoit 113 457 visiteurs durant un mois. On dsigne par X lenavigateur internet utilis et Y le systme dexploitation utilis.</p><p>X \ Y Windows Mac LinuxChrome 14103 1186 427Firefox 30853 4392 3234Internet Explorer 47389 23 0Safari 668 6416 0Autres 2974 40 1752</p><p>(a) Identifier la population, sa taille ainsi que les variables tudies en prcisant leur type.(b) Quelle est la proportion de visiteurs sous Windows ?(c) Quelle proportion de visiteurs utilisent le navigateur Safari ?(d) Parmi les utilisateurs de Mac, quelle proportion utilise Chrome ?(e) Parmi les utilisateurs de Safari, quelle proportion est sous Windows ?( f ) Reprsenter graphiquement la distribution des proportions par Navigateur pour chaque</p><p>systme dexploitation. Les variables X et Y sont-elles indpendantes ?</p><p>Corrig de lexercice 1.(a) Population : visiteurs du site internet tudi.</p><p>Individu : un visiteur du site internet.Taille : 113 457.Variables tudies : on tudie deux variables, savoir X et Y . La variable X est le navi-gateur utilis par le visiteur ; cest une variable qualitative nominale. La variable Y est lesystme dexploitation utilis par le visiteur ; cest une variable qualitatif nominale.</p><p>1</p></li><li><p>(b) On recherche la proportion marginale P(Y = Windows). Pour cela, on dtermine les effec-teurs marginaux dans le tableau de contingence :</p><p>X \ Y Windows Mac Linux TOTALChrome 14103 1186 427 15716Firefox 30853 4392 3234 38479Internet Explorer 47389 23 0 47412Safari 668 6416 0 7084Autres 2974 40 1752 4766TOTAL 95987 12057 5413 113457</p><p>Leffectif marginal de la modalit Windows pour Y est donc 95 987. On a donc :</p><p>P(Y = Windows) =95 987</p><p>113 457= 84,60 %.</p><p>(c) Leffectif marginal de la modalit Safari pour X est 7084 donc</p><p>P(X = Safari) =7084</p><p>113 457= 6,24 %.</p><p>(d) On est sous la condition Y = Mac donc on extrait du tableau de contingence la colonneMac et on calcule les proportions correspondantes :</p><p>X | Y = Mac Effectif Proportion (%)Chrome 1186 9,84Firefox 4392 36,43Internet Explorer 23 0,19Safari 6416 53,21Autres 40 0,33TOTAL 12057 100</p><p>On a donc :</p><p>P(X = Chrome | Y = Mac) = 9,84 %.</p><p>(e) On est sous la condition X = Safari, donc on extrait du tableau de contingence la lignecorrespondant Safari :</p><p>Y | X = Safari Windows Mac Linux TOTALEffectif 668 6416 0 7084Proportion (%) 9,43 90,57 0 100</p><p>On a donc :</p><p>P(Y = Windows | X = Safari) = 9,43 %.</p><p>( f ) Puisque lon demande la rpartition des proportions, on met les proportions en ordonne.Puisque lon demande la rpartition par Navigateur, on met la variable X en abscisse. Fina-lement, puisque lon demande la rpartition pour chaque systme dexploitation, on doit</p><p>2</p></li><li><p>dterminer les proportions conditionnelles de X sachant les modalits de Y , cest--direX | Y = Windows, X | Y = Mac et X | Y = Linux. la question (d), on a dj dterminer X | Y = Mac donc il nous reste X | Y = Windowset X | Y = Linux :</p><p>X | Y = Windows Effectif Proportion (%)Chrome 14103 14,69Firefox 30853 32,14Internet Explorer 47389 49,37Safari 668 0,7Autres 2974 3,1TOTAL 95987 100</p><p>X | Y = Linux Effectif Proportion (%)Chrome 427 7,89Firefox 3234 59,75Internet Explorer 0 0Safari 0 0Autres 1752 32,37TOTAL 5413 100,01</p><p>On est maintenant en mesure de tracer le diagramme en tuyaux dorgues :</p><p>Chrome Firefox IE Safari Autres</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60WindowsMacLinux</p><p>Navigateur</p><p>Proportion (%)</p><p>Pour chaque modalit de X, les tuyaux ne sont pas du tout de la mme hauteur ; celasignifie que le systme dexploitation influe fortement sur le navigateur utilis. Autrementdit, il ny a pas indpendance entre systme dexploitation et navigateur utilis.</p><p>Exercice 2. En 1885, Francis Galton publie un tableau de donnes comparant la taille Y desenfants avec la taille X de leurs parents (la taille des parents est gale la moyenne de la taille</p><p>3</p></li><li><p>du pre et de la mre). Pour compenser les diffrences de tailles entre sexes, toutes les taillesdes personnes de sexe fminin ont t multipli par 1,08. Les tailles sont exprimes en pouces(1 pouce = 2,54 cm).</p><p>X \ Y ]60 ; 61,7] ]61,7 ; 63,7] ]63,7 ; 65,7] ]65,7 ; 67,7] ]67,7 ; 69,7] ]69,7 ; 71,7] ]71,7 ; 73,7] ]73,7 ; 75]]62 ; 64] 1 2 5 4 2 0 0 0]64 ; 66] 2 14 17 32 16 7 1 0]66 ; 68] 0 14 36 108 93 34 4 0]68 ; 70] 1 8 47 100 135 84 22 5]70 ; 72] 1 1 2 11 38 35 18 5]72 ; 74] 0 0 0 0 3 3 13 4</p><p>Les bornes des classes extrmes ont t fixes arbitrairement pour les besoins de lexercice.</p><p>(a) Prciser la population, les individus, la taille de la population ainsi que les variablestudies.</p><p>(b) Quelle est la proportion denfants dont la taille est comprise entre 65,7 et 67,7 ?(c) Parmi les enfants dont la taille est comprise entre 71,7 et 73,7, quelle proportion a des</p><p>parents dont la taille est entre 70 et 72 ?</p><p>(d) Quelle est la taille moyenne des enfants dont les parents ont une taille comprise entre 68et 70 ? Convertir le rsultat en centimtres.</p><p>(e) Mme question pour la taille mdiane.( f ) Mme question pour lcart-type.</p><p>Corrig de lexercice 2.(a) Population : les enfants tudis par Galton (en notant qu chaque enfant, on associe ses</p><p>deux parents).Individu : un enfant (et ses parents).Taille de la population : 938 (cest la somme de tous les lments du tableau).Variables tudies : la variable X taille de lenfant (quantitative continue) et la variableY taille des parents (quantitative continue).</p><p>(b) On cherche la proportion marginale P(65,7 X 67,7) :</p><p>P(65,7 X 67,7) = 4 + 32 + 108 + 100 + 11938</p><p>=255938</p><p>= 27,19 %.</p><p>(c) On cherche la proportion conditionnelle P(X ]70 ; 72] | Y ]71,7 ; 73,7]). Pour lacalculer, on extrait la colonne Y ]71,7 ; 73,7] du tableau et on calcule les proportions :</p><p>X | Y ]71,7 ; 73,7] Effectifs Proportions (%)]62 ; 64] 0 0]64 ; 66] 1 1,72]66 ; 68] 4 6,9]68 ; 70] 22 37,93]70 ; 72] 18 31,03]72 ; 74] 13 22,41TOTAL 58</p><p>4</p></li><li><p>On a donc</p><p>P(X ]70 ; 72] | Y ]71,7 ; 73,7]) = 31,03 %.</p><p>(d) On regarde la distribution conditionnelle de Y sachant que X ]68 ; 70]. On extrait doncdu tableau la ligne correspondante (on met les proportions cumules pour les questionssuivantes) :</p><p>Y | X ]68 ; 70] ]60 ; 61,7] ]61,7 ; 63,7] ]63,7 ; 65,7] ]65,7 ; 67,7] ]67,7 ; 69,7] ]69,7 ; 71,7] ]71,7 ; 73,7] ]73,7 ; 75] TOTALEffectifs 1 8 47 100 135 84 22 5 402Proportions (%) 0,25 1,99 11,69 24,88 33,58 20,9 5,47 1,24Prop. cumul. (%) 0,25 2,24 13,93 38,81 72,39 93,29 98,76 100Centre 60,85 62,7 64,7 66,7 68,7 70,7 72,7 74,35</p><p>La moyenne est donc :</p><p>Y |X]68;70] =</p><p>1 60,85 + 8 62,7 + 47 64,7 + 100 66,7 + 135 68,7+ 84 70,7 + 22 72,7 + 5 74,35402</p><p>=27 457,80</p><p>402= 68,30.</p><p>Pour convertir en centimtres, on utilise la formule 1 pouce = 2,54 cm :</p><p>Y |X]68;70] = 68,30 2,54 = 173,48.</p><p>(e) La mdiane de Y | X ]68 ; 70] se calcule partir des proportions cumules donnes dansle tableau prcdent. La classe correspondant la proportion cumule 50 % est ]a ; b] =]67,7 ; 69,7] donc la mdiane est donne par la formule</p><p>mdiane = a +[(b a) 50 P(X a)</p><p>P(X b) P(X a)</p><p>]= 67,7 +</p><p>[(69,7 67,7) 50 38,81</p><p>72,39 38,81</p><p>]= 67,7 +</p><p>[2 11,19</p><p>33,58</p><p>]= 67,7 + [2 0,3332]= 67,7 + 0,67= 68,37.</p><p>Pour convertir en centimtres, on utilise la formule 1 pouce = 2,54 cm :</p><p>mdiane = 68,37 2,54 = 173,66.</p><p>5</p></li><li><p>( f ) Calculons lcart-type :</p><p>Y |X]68;70] =</p><p> 1 60,852 + 8 62,72 + 47 64,72 + 100 66,72+ 135 68,72 + 84 70,72 + 22 72,72 + 5 74,352</p><p>402 2Y |X]68;70]</p><p>=</p><p>1 877 735,57</p><p>402 4664,89</p><p>=</p><p>4670,98 4664,89</p><p>=</p><p>6,09= 2,47.</p><p>Pour convertir en centimtres, on utilise la formule 1 pouce = 2,54 cm :</p><p>Y |X]68;70] = 2,47 2,54 = 6,27.</p><p>Exercice 3. Les mesure du nombre X de jours de pluie et de la hauteur Y (en mm) de pluie Paris tous les 5 ans entre 1960 et 1995 sont rcapitules dans le tableau suivant.</p><p>anne 1960 1965 1970 1975 1980 1985 1990 1995X 198 196 199 164 170 163 149 162Y 739 880 631 658 690 501 501 670</p><p>(a) Reprsenter graphiquement le nuage de points.(b) Calculer le coefficient de corrlation.(c) Y a-t-il une relation de liaison entre les variables X et Y ?</p><p>Corrig de lexercice 3.(a) Pour tracer un nuage de points, on place chaque donne individuelle sur un graphique avec</p><p>X en abscisse et Y en ordonne :</p><p>X (jours de pluie)</p><p>Y (hauteur de pluie)</p><p>100 150 200400</p><p>500</p><p>600</p><p>700</p><p>800</p><p>900</p><p>6</p></li><li><p>(b) Pour calculer le coefficient de corrlation, on doit calculer la covariance et les deux cart-types. Pour calculer la covariance, on a besoin des deux moyennes. Rappelons les diff-rentes formules lorsquon dispose des donnes individuelles :</p><p>X =</p><p>x(i)N</p><p>, X =</p><p>x(i)2</p><p>N X, Cov(X,Y) =</p><p>x(i)y(i)N</p><p> XY</p><p>Moyenne de X. On a</p><p>X =</p><p>x(i)N</p><p>=198 + 196 + 199 + 164 + 170 + 163 + 149 + 162</p><p>8=</p><p>14018</p><p>= 175,125.</p><p>Moyenne de Y. On a</p><p>Y =</p><p>y(i)N</p><p>=739 + 880 + 631 + 658 + 690 + 501 + 501 + 670</p><p>8=</p><p>52708</p><p>= 658,750.</p><p>cart-type de X. On a</p><p>X =</p><p>x(i)2</p><p>N 2X</p><p>=</p><p>1982 + 1962 + 1992 + 1642 + 1702 + 1632 + 1492 + 1622</p><p>8 175,1252</p><p>=</p><p>248031</p><p>8 30 668,766</p><p>=</p><p>31 003,875 30 668,766</p><p>=</p><p>335,109= 18,306.</p><p>cart-type de Y. On a</p><p>Y =</p><p>y(i)2</p><p>N 2Y</p><p>=</p><p>7392 + 8802 + 6312 + 6582 + 6902 + 5012 + 5012 + 6702</p><p>8 658,7502</p><p>=</p><p>3578648</p><p>8 433 951,562</p><p>=</p><p>447 331,000 433 951,562</p><p>=</p><p>13 379,438= 115,670.</p><p>7</p></li><li><p>Covariance de X et Y. On a</p><p>Cov(X,Y) =</p><p>x(i)y(i)N</p><p> XY</p><p>=198 739 + 196 880 + + 162 670</p><p>8 175,125 658,750</p><p>=934435</p><p>8 115 363,594</p><p>= 116 804,375 115 363,594= 1440,781.</p><p>Coefficient de corrlation de X et Y. On a</p><p>r(X,Y) =Cov(X,Y)XY</p><p>=1440,781</p><p>18,306 115,670</p><p>=1440,7812117,455</p><p>= 0,680.</p><p>(c) Le coefficient de corrlation est proche de 0,7 donc on peut considrer que les variablessont assez fortement lies. On peut reprsenter la droite de rgression qui illustre cettedpendance :</p><p>X (jours de pluie)</p><p>Y (hauteur de pluie)</p><p>100 150 200400</p><p>500</p><p>600</p><p>700</p><p>800</p><p>900</p><p>Le fait que les points sont relativement proches de la droite illustre la corrlation relative-ment forte.</p><p>8</p><p>Statistiques descriptives bivaries</p></li></ul>