Probabilités, statistiques - livres-ebooks- ?· Probabilités, statistiques et analyses multicritères…

  • Published on
    10-Sep-2018

  • View
    212

  • Download
    0

Embed Size (px)

Transcript

<ul><li><p>Probabilits, statistiqueset analyses multicritres</p><p>Application aux sciences exprimentales(exercices corrigs)</p><p>Mathieu ROUAUDProfesseur Agrg de Sciences Physiquesen classes prparatoires aux grandes coles d'ingnieurs.Diplm en Physique Thorique.</p><p>Vous pouvez reproduire et partager ce livre librement condition de citer l'auteur et de ne pas en faire d'usage commercial. Mais pas de libert sans solidarit. Merci de soutenir mon travail de publication en achetant le livre ou en faisant un don. Je pourrais ainsi crire d'autres livres que j'ai en projet. Merci pour votre intrt port pour le livre et bonne lecture !</p><p>Pour un don envoyez un chque l'ordre de Mathieu ROUAUD l'adresse suivante : Boudiguen 29310 QUERRIEN (FRANCE).Merci beaucoup pour votre aide ! En esprant publier de nouveaux livres. Site internet de l'auteur : www.science-et-decouvertes.fr</p><p>http://www.science-et-decouvertes.fr/http://www.lulu.com/shop/mathieu-rouaud/probabilit%C3%A9s-statistiques-et-analyses-multicrit%C3%A8res/paperback/product-20202190.html</p></li><li><p>Pour un meilleur partage de la connaissance et l'accs au plus grand nombre, le livre est en licence libre, le livre numrique est gratuit et pour minimiser le cot de la version papier, il est imprim en noir et blanc et sur papier conomique.</p><p>livre numrique :www.incertitudes.fr/proba-stat-acp/livre.pdf</p><p>livre papieren auto-dition sur lulu.com</p><p>Ce livre est sous licence Creative Commons Attribution-Non Commercial 3.0. </p><p>Vous tes libres : de reproduire, distribuer et communiquer cette cration au public ,</p><p>de modifier cette cration .</p><p>Selon les conditions suivantes : Attribution. Vous devez citer le nom de l'auteur original de la manire indique par l'auteur de l'uvre ou le titulaire des droits qui vous confre cette autorisation (mais pas d'une manire qui suggrerait qu'ils vous soutiennent ou approuvent votre utilisation de l'uvre). </p><p>Pas d'Utilisation Commerciale. Vous n'avez pas le droit d'utiliser cette cration des fins commerciales. </p><p> A chaque rutilisation ou distribution de cette cration, vous devez faire apparatre clairement au public les conditions contractuelles de sa mise disposition. La meilleure manire de les indiquer est un lien vers cette page web : http://creativecommons.org/licenses/by-nc/2.0/deed.fr </p><p> Chacune de ces conditions peut tre leve si vous obtenez l'autorisation du titulaire des droits sur cette uvre. </p><p> Rien dans ce contrat ne diminue ou ne restreint le droit moral de l'auteur ou des auteurs. </p><p>Date de parution : juin 2012</p><p>http://creativecommons.org/licenses/by-nc/2.0/deed.fr%20http://www.lulu.com/shop/mathieu-rouaud/probabilit%C3%A9s-statistiques-et-analyses-multicrit%C3%A8res/paperback/product-20202190.html</p></li><li><p>Avant-propos</p><p>Cet ouvrage se veut accessible et pdagogique. Il est le fruit d'interrogations personnelles sur la nature probabiliste des mesures en sciences. Dans un cursus classique ces aspects ne sont pas, ou peu, abords. Il est important que les fondements exprimentaux et pratiques des sciences soient complmentaires d'une science au tableau en cours magistraux. Il existe une beaut scientifique qui nat de l'interaction entre la thorie et l'exprience.</p><p>Tout en introduisant les principes fondamentaux de la statistique, les deux premiers chapitres expliquent comment dterminer les incertitudes dans diffrentes situations exprimentales. Beaucoup d'exemples sont issus de cours et travaux pratiques raliss en math sup.</p><p>Le troisime chapitre aborde les analyses multicritres telles qu'elles ont t enseignes en deuxime anne d'cole d'ingnieur (cole Hubert Curien / Matrise de l'efficacit nergtique).</p><p>Bonne lecture !</p><p>Remerciements :Je remercie Grgoire BONNET (ingnieur charpentier) et ric NOIZET (professeur Agrg de Chimie en prpa) pour leurs multiples apports la clart pdagogique de l'ouvrage. Un grand merci Reine pour sa relecture prcise et consciencieuse. Pleins de mercis, Aurlien SEMACH (tudiant) et, aux enseignants de sciences-physiques Franoise MARCADET (pour ses contri-butions en mtrologie) et Julien BONVALET.Merci la vie et tous ceux qui m'ont prcd.</p></li><li><p>Table des matires</p><p>I. VARIABLE ALATOIRE....................................1 A. Grandeurs et mesures......................................1 B. Centre d'une distribution..................................1 C. Dispersion d'une distribution...........................3 D. Exemples de distributions................................4 E. Thorme central limite...................................7</p><p>1) Population et chantillons....................................72) Le thorme central limite.................................103) Coefficient de Student et incertitude.................124) Exemples............................................................14</p><p> F. Distribution de Gauss.....................................181) Dfinition d'une distribution continue...............182) Courbe de Gauss................................................193) Loi normale standard.........................................21</p><p> G. Test d'hypothse............................................22 H. Test du Khi-deux...........................................24 I. Sources des incertitudes..................................27 J. Exercices.........................................................31</p><p>II. CORRLATIONS ET INDPENDANCES.......37 A. Coefficient de corrlation..............................37 B. Formule de propagation des incertitudes.......42</p><p>1) Formule de propagation des cart-types............422) Calcul d'incertitude............................................43</p><p> C. Rgression linaire........................................481) Principe et formules...........................................48</p></li><li><p>2) Dtermination du zro absolu............................523) Rgression avec barres d'erreurs........................54</p><p> D. Exercices ......................................................57III. APPROCHES MULTICRITRES....................67</p><p> A. Mthode par pondration...............................68 B. Analyse en Composantes Principales............71</p><p>1) Principes............................................................712) Une deuxime illustration..................................843) Rsum..............................................................87</p><p> C. Exercices.......................................................88IV. COMPLMENTS.............................................92</p><p> A. Mesure avec une rgle...................................92 B. Mtrologie...................................................104 C. Thermodynamique.......................................112 D. Indpendance des variables.........................118</p><p>V. DEVOIRS.........................................................120 A. Devoir Suricate............................................120 B. Devoir Narval..............................................127</p><p>VI. CORRECTIONS.............................................134VII. OUTILS MATHMATIQUES......................164VIII. Bibliographie / Sources / Logiciels / Illustration de couverture.........................................................167IX. TABLES / Index..............................................172</p><p> A. Coefficients de Student................................172 B. Valeurs critiques de Khi-deux.....................173</p></li><li><p>I. VARIABLE ALATOIRE</p><p> A. Grandeurs et mesures</p><p>Soit X une variable alatoire et n ralisations {xi} de cette variable.</p><p>Nous pouvons simplement estimer une grandeur classique : par exemple, combien y-a-t-il de jours dans une semaine ? La rponse est sans ambigut. Par contre pour une grandeur statistique l'approche est plus subtile. Imaginons des tudiants qui font des expriences de calorimtrie pour mesurer la capacit thermique de l'eau1. Les diffrents groupes mesurent les valeurs suivantes : {5100; 4230; 3750; 4560; 3980} J/K/kg. Que vaut alors la capacit ? Nous donnerons dans ce chapitre une rponse cette question. Elle sera de nature probabiliste.</p><p> B. Centre d'une distribution</p><p>Nous cherchons une caractristique du centre de la distribution des observations {xi}. Il en existe plusieurs, le mode, par exemple, est facile dterminer, il s'agit de la valeur la plus reprsente (illustrations page 4). Nous </p><p>1 PHYSIQUE : Quantit d'nergie fournir un kilogramme d'eau pour que sa temprature s'lve de 1C. L'eau emmagasine ainsi de l'nergie et peut la restituer par la suite en diminuant sa temprature. Tables : ceau = 4180 Joules par degr Celsius et par kilogrammes. </p><p>1</p></li><li><p>avons aussi la mdiane qui correspond la valeur qui spare la distribution en deux parties gales. Mais la plus utilise est la moyenne qui reprsente au mieux le centre d'une distribution :</p><p>x=x1 x2...x i...xn</p><p>n soit </p><p>x=i=1</p><p>n</p><p>x i</p><p>n</p><p>2</p><p>Pour la capacit thermique de l'eau nous obtenons :</p><p>c=51004230375045603980</p><p>5=4324 J /K / kg</p><p>Nous avons considr la moyenne arithmtique. Nous aurions pu prendre la moyenne gomtrique : </p><p>x=n x i</p><p>Par exemple, pour deux tempratures 20C et 40C, la moyenne gomtrique est 20 C40 C28,3 Calors que la moyenne arithmtique est 30C. Dans la pratique on constate que la moyenne arithmtique est mieux adapte.</p><p>2 MATH : se dit la moyenne de x est gale la somme de 1 n des x i, le tout divis par n. Pour la moyenne gomtrique nous considrons la racine nime du produit des xi. x, "x moyen", se dit aussi "x barre".</p><p>2</p></li><li><p> C. Dispersion d'une distribution</p><p>Il s'agit d'estimer ce que nous pourrions aussi appeler la largeur d'une distribution. La grandeur la plus simple dterminer est l'tendue, diffrence entre les valeurs maximale et minimale. Mais celle-ci est trs sensible aux valeurs extrmes qui ne sont pas toujours reprsentatives, et peuvent mme parfois tre absurdes.</p><p>Dans les faits, la grandeur la plus utilise est l'cart-type :</p><p>s=i=1n</p><p>x ix2</p><p>n1</p><p>Pour l'cart-type de la capacit thermique de l'eau nous obtenons :</p><p>soit sc530 J /K / kg</p><p>Nous pourrions aussi considrer l'cart moyen par rapport la moyenne (voir l'exercice 1).</p><p>3</p></li><li><p>Pour l'cart-type si nous divisions par n au lieu de n-1, nous obtiendrions l'cart quadratique moyen. Le choix de l'cart-type sera justifi par la simplicit des formules qui en dcouleront. De plus nous travaillons souvent avec n grand et la diffrence entre les deux types d'carts quadratiques est alors minime.</p><p> D. Exemples de distributions</p><p>Cas 1 :</p><p>4</p><p>119</p><p>10141189</p><p>127889</p><p>1114 moyenne = 10 cart-type= 2,0710 mode= 9 tendue= 79 mdiane= 9,5 cart quadratique moyen= 2,00</p><p>x1x11</p><p>x12</p><p>x13</p><p>x14</p><p>x15</p><p>x16</p><p>x17</p><p>x18</p><p>x19</p><p>x110</p><p>x111</p><p>x112</p><p>x113</p><p>x114</p><p>x115</p><p>x116</p><p>7 8 9 10 11 12 13 14 15 16 17 18 190</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>6</p><p>x1</p><p>frqu</p><p>ence</p><p>s</p></li><li><p>Cas 2 :</p><p>Cas 3 :</p><p>5</p><p>1513121314131619131410161415 moyenne = 14 cart-type= 2,0013 mode= 13 tendue= 914 mdiane= 14 cart quadratique moyen= 1,94</p><p>x2x21</p><p>x22</p><p>x23</p><p>x24</p><p>x25</p><p>x26</p><p>x27</p><p>x28</p><p>x29</p><p>x210</p><p>x211</p><p>x212</p><p>x213</p><p>x214</p><p>x215</p><p>x216</p><p>7 8 9 10 11 12 13 14 15 16 17 18 190</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>6</p><p>x2</p><p>frqu</p><p>ence</p><p>s</p><p>1010121198</p><p>1099</p><p>119</p><p>111010 moyenne = 10 cart-type= 1,0311 mode= 10 tendue= 410 mdiane= 10 cart quadratique moyen= 1,00</p><p>x3x31</p><p>x32</p><p>x33</p><p>x34</p><p>x35</p><p>x36</p><p>x37</p><p>x38</p><p>x39</p><p>x310</p><p>x311</p><p>x312</p><p>x313</p><p>x314</p><p>x315</p><p>x316</p><p>7 8 9 10 11 12 13 14 15 16 17 18 190</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>6</p><p>x3</p><p>frqu</p><p>ence</p><p>s</p></li><li><p>La moyenne n'est pas toujours la valeur la plus reprsente (cas 1 et 2) et elle peut mme dans certains cas tre absente. Dans le cas 3 la courbe est symtrique ce qui implique l'galit de la mdiane et de la moyenne.</p><p>Sur les trois exemples certaines valeurs sont reprsentes plusieurs fois, on parle alors de la frquence fi d'une </p><p>valeur xi. Nous avons n=i=1</p><p>c</p><p>f i , o c correspond au </p><p>nombre de valeurs de xi diffrentes auxquelles nous attribuons une frquence (dans la suite, c sera aussi le nombre de classes).La moyenne et l'cart-type peuvent alors s'exprimer ainsi :</p><p>x=i=1</p><p>c</p><p>f ixi</p><p>n=</p><p>i=1</p><p>c f inxi s=i=1</p><p>c</p><p>f ix ix2</p><p>n1</p><p>Parfois on rassemble les valeurs par classe, par exemple si nous nous intressons la taille des habitants d'une ville nous pouvons rassembler tous les habitants qui ont une taille comprise entre 160 cm et 170 cm dans le mme ensemble appel classe. Leur nombre dans cette classe est la frquence (ou effectif de la classe) et la valeur est prise gale au milieu de la classe, ici 165 cm (dmarche illustre dans l'exercice 5).</p><p>Plus la courbe est ramasse sur son centre plus l'cart-type est faible (sur le cas 3 l'cart est deux fois plus faible que sur les cas 1 et 2).</p><p>6</p></li><li><p> E. Thorme central limite</p><p>1) Population et chantillons</p><p>Considrons une ville d'un million d'habitants. Pour sonder la population nous pouvons interroger un chantillon de seulement mille personnes tires au hasard. A partir de cet chantillon de n=1000 individus, nous pouvons, grce la statistique, avoir des informations sur la population toute entire. Plus la taille de l'chantillon est grand, plus les rsultats seront prcis. Nous appelonsx la moyenne de l'chantillon et s son cart-type. Pour </p><p>la population nous notons (lettre grec mu) la moyenne et (sigma) l'cart-type. Plus l'chantillon est grand, plus les valeurs de x et de s de cet chantillon sont amenes se rapprocher de celles et de la population.</p><p>Comme dans le cas des sondages d'opinion avec des chantillons de l'ordre de mille personnes, si nous mesurons la taille de mille habitants qui sont choisis au hasard parmi la population d'une ville d'un million d'habitants, la moyenne de la taille sur cet chantillon a de forte chance d'tre proche de celle sur l'ensemble de la population, mais n'a aucune raison de lui tre gale.</p><p>Illustrons maintenant par le jeu du lancer de pices. A chaque lancer nous obtenons une ralisation de la variable alatoire pile ou face. Ici la population est infinie, nous pouvons rpter le lancer indfiniment et avoir une infinit de mesures. De plus, les probabilits tant </p><p>7</p></li><li><p>connues, nous pouvons dterminer l'avance les caractristiques de la population.Tout d'abord, quand la taille de l'chantillon devient trs grande et donc infinie, l'chantillon s'identifie la population : =lim</p><p>nx 3.</p><p>Ensuite nous voyons apparatre la notion de probabilit :</p><p>p i=limn</p><p>f in</p><p>o pi est la probabilit de ralisation de </p><p>l'vnement xi.D'aprs la formule page 6 nous avons ainsi l'expression de la moyenne pour la population : = pix i .Nous avons pi=1 , car nous considrons tous les vnements possibles (1=100%).Nous associons x0=0 l'observation face, et x1=1 pour pile. Comme la pice est quilibre p0=p1=1/2=0,5=50% et =p0.x0 +p1. x1. Nous avons jug inexistant l'vnement la pice reste sur la tranche.De mme nous avons : =lim</p><p>ns et en prenant la limite </p><p>de la formule pour s page 6 nous obtenons= p ix i2 (avec pour n grand, n-1 pris gal </p><p>n).</p><p>Au final : =0,5 et =0,5 .</p><p>3 MATH : se lit est gal la limite de x quand n tend vers l'infini.</p><p>8</p></li><li><p>Prlevons un chantillon en lanant neuf pices : {0; 1; 1; 0; 1; 1; 1; 0; 0}. </p><p>Nous avons alors x0,56 et s0,53 .Supposons que nous tirions de nombreuses fois neuf pices alatoirement au sein de la mme population. A chaque fois nous a...</p></li></ul>