La curva normal - ?· La curva normal Vicente Manzano Arrondo – 2012-2014 La respuesta está en la…

  • Published on
    19-Aug-2018

  • View
    212

  • Download
    0

Embed Size (px)

Transcript

  • La curva normalVicente Manzano Arrondo 2012-2014

    La respuesta est en la historiaAbraham De Moivre naci en Francia en 1667, el mismo ao en que su compatriota

    Jean-Baptiste Denys realiz la primera transfusin de sangre a un humano y otro Jean-Baptiste, esta vez de apellido Poquelin, pero conocido como Molire, escribiera sus ltimas obras, ya enfermo.

    De Moivre se form con varios maestros, con los que mostr un excelente intelecto para las matemticas. Pero aproximadamente con 20 aos tuvo que huir de Francia por ser calvinista. Se refugi en Inglaterra. Aterriz en terreno ingls ms o menos cuando Isaac Newton andaba publicando su famoso libro Principia Matemtica (que, realmente sellamaba Philosophiae Naturalis Principia Mathematica). De Moivre conoci a este famoso ingls, pasado a la posteridad para muchos como la persona ms inteligente de la historia. Curiosa sentencia dedicada a quien fuera un puritano escrupuloso y un misgino confeso que expir orgullosamente virgen tras forzar comisiones para quitarse enemigos de encima y hacer la vida imposible a mucha gente. Por su parte, De Moivre muri en el exilio, tras dcadas en el lmite continuo de la pobreza, aunque reconocido como un geniomatemtico por algunos de sus contemporneos. Tena nada menos que 87 aos. Era 1754, el mismo ao en que naci quien sera Luis XVI, el rey guillotinado en la revolucin francesa.

    Como muchas personas con un intelecto muy desarrollado y algo de tiempo para jugar con l (vivi pobre, pero no naci pobre), De Moivre se dedic a cosas intiles sin cuyo desarrollo el conocimiento cientfico no habra llegado hasta donde hoy se encuentra(est donde est ese sitio). Otros franceses an ms famosos que l, como Pascal o Fermat (que murieron ambos cinco aos antes de nacer De Moivre), desarrollaban la teora de las probabilidades con tareas tan serias como el juego de los dados o las partidas de cartas. De Moivre segua intrigado por estas cuestiones, adems de por otras muchas, observando un efecto grfico curioso. Vamos a reproducirlo, ms o menos.

    Al lanzar una moneda al aire, hay la misma probabilidad de que aparezca cara que cruz. Hablamos de una probabilidad de 1/2 (un medio o 0,5). Si se lanza una moneda una vez, el grfico de probabilidades para los posibles resultados muestra dos barras con la misma altura: 0,5 para el resultado 1 cara (o 0 cruces), y 0,5 para el resultado 0 caras (es decir, 1 cruz). Si lanzamos la moneda mil veces, cabra esperar una altura de 500 resultados para la cara y otra barra con igualmente 500 resultados para la cruz. Dado que la probabilidad es muy suya, tal vez no sea 500 sino 498, por ejemplo; pero no nos pondremos muy exigentes con ello.

    Si se lanza la moneda dos veces, los resultados posibles son: 0, 1 y 2 para el nmero de caras. Las barras ya no muestran la misma altura. Es natural: lo ms probable es que de dos lanzamientos salga una cara y una cruz (probabilidad de 0,5), antes que dos caras (probabilidad de 0,25) o dos cruces (probabilidad de 0,25). Al lanzar la moneda tres veces, los resultados posibles aumentan (0, 1, 2 o 3 caras). Las siguientes representaciones grficas (agrupadas como figura 1) muestran esa evolucin. Al sumar la altura de todas las barras, el resultado ha de ser siempre el mismo: 1, pues representa la totalidad expresada como proporcin. Si la expresramos como porcentaje, el total sera 100%.

    La forma que iba tomando la distribucin ante los ojos y deducciones del matemtico era atractiva (ya ves, la gente se entretiene con cualquier cosa). De Moivre observ que conforme aumenta el nmero de lanzamientos de monedas y hay ms resultados posibles para el nmero de caras (o de cruces, qu ms da), la forma de la

    1

  • representacin grfica se pareca cada vez ms a una campana. Lo de menos era la forma final, lo interesante era la percepcin de que se aproximaba a algo. Eso es un aliciente irresistible para un matemtico. Y no se resisti.

    0 10

    0,1

    0,2

    0,3

    0,4

    0,5

    0 1 20

    0,1

    0,2

    0,3

    0,4

    0,5

    0 1 2 3 40

    0,1

    0,2

    0,3

    0,4

    0 1 2 3 4 5 6 7 8

    Figura 1. Evolucin hacia la normal del lanzamiento de una moneda.

    De Moivre se plante identificar la funcin matemtica a la que se aproxima la distribucin de probabilidades de n lanzamientos de una moneda. Y la encontr. Imagina la de das que se llev el hombre en esta tarea, en una poca sin ordenadores ni calculadoras de bolsillo, donde la gente escriba mojando una pluma de ave en un frasco de cristal con tinta de calamar. El resultado es, para muchas personas, una funcin matemtica de extremada belleza. Para otras, tiene la misma hermosura que un caracol comiendo perejil. Sea como fuere, esta curva inici con De Moivre una historia que llega hasta ti. La funcin que encontr el calvinista exiliado suministra la altura de la curva para cada valor del eje horizontal, que es:

    f (x ) = 1

    S e ( X i X )2

    S2 2

    = 1eZ i2 2

    = (eZ i2 2)1

    2

    Para quien no maneje con soltura las expresiones matemticas, la frmula anterior puede generarle cierto estupor. Observa, no obstante, que todos sus elementos deben resultarte familiares. S es la desviacin tipo de la variable X, de la que puedes ver tambinla representacin del valor concreto (Xi) y la media aritmtica ( X ). e es el llamado nmero natural, cuyo valor tiene una cantidad infinita de dgitos decimales (2,71828182845904...). Y es el nmero pi, cuyo valor, tambin provisto de infinitos dgitos decimales, viene a ser 3,14159265358979... A la derecha observas la misma funcin, pero expresada para puntuaciones tipo en lugar de puntuaciones originales. En ese caso, sabes que S=1 (por lo que desaparece) y el exponente de e se simplifica mucho.

    2

  • Al representar grficamente la funcin que encontr De Moivre, se obtiene lo que puedes observar en la figura 2. Casi un siglo despus, a inicios del XIX, un ya famoso matemtico y fsico, Gauss, lanz al estrellato la curva normal. Este genio del siglo utiliz la curva casi hasta en la sopa, especialmente para estudiar los errores de medicin en astronoma, un asunto que haba cautivado a Galileo, quien por cierto casi desarrolla la curva normal un siglo antes que De Moivre. Tal fue el papel de Gauss en la fama y utilizacin de esta funcin, que es normal referirse a ella como campana de Gauss. Antes que este alemn de lujo, otro francs, temido por los estudiantes de probabilidad desde hace tres siglos, Laplace, formaliz varios desarrollos a partir de la curva normal, por lo que tambin se la conoce como curva de Laplace-Gauss. En fin, para todos los gustos.

    Figura 2. Curva normal.

    Por qu nos ha dado por la normal

    Eso, poco ms o menos, es lo que les escuchaba a los vecinos cuando yo era pequeo. Ella le gritaba T cundo vas a ser normal?. l le responda Y dale con lo normal!.

    La curva normal aparece con frecuencia y es difcil de ver, depende del contexto. Existen muchas caractersticas que parecen comportarse segn una ley normal, es decir, cuya representacin grfica se asemeja a la curva del seor De Moivre. Un ejemplo clsico es la altura. Si medimos la altura de una poblacin numerosa, encontraremos que existe una gran aglomeracin en torno a una altura media o caracterstica. Conforme nos alejamos de ella, la frecuencia disminuye rpidamente, hasta que esa disminucin desacelera, es decir, sigue disminuyendo pero con ms suavidad, perdindose en los extremos. Otras muchas caractersticas no siguen muy bien una funcin normal, pero se aproximan en el sentido de que muestran cierta simetra y agolpamiento central con dispersin en los extremos.

    No obstante, en sentido estricto, hay pocas variables que sigan realmente una ley normal. Lo que s ocurre ms o menos segn De Moivre - Laplace - Gauss es que muchas distribuciones indirectas son normales. Ocurre con las distribuciones muestrales, lo que comprobaremos en el monogrfico siguiente sobre la estimacin estadstica. Recuerda que una distribucin muestral es un conjunto de datos donde cada uno de ellos proviene de medir un mismo estadstico pero en muestras diferentes. Por ejemplo, la

    3

  • distribucin muestral de medias es el resultado de calcular la media aritmtica en una infinidad de muestras (imagina, por ejemplo, un milln de muestras, de cada una de las cuales se ha calculado la media aritmtica obteniendo un milln de resultados). Pues bien, la forma con que se distribuyen esas medias es habitualmente normal. Lo mismo ocurre con la distribucin muestral de proporciones, etc. La facilidad con que los estadsticos se distribuyen segn una ley normal es una circunstancia que ha desarrolladola estadstica muchsimo. Y lo veremos en otra unidad, si es que quieres que nos encontremos en ella. El modo en que De Moivre lleg a formalizar la curva normal es un buen ejemplo de lo que estamos hablando: una distribucin originalmente binomial (tipo xito/fracaso o cara/cruz) se aproxima a la normal conforme aumenta n, es decir, el nmero de veces que se lanza la moneda al aire y se cuenta si ha salido cara o cruz.

    Podemos pensar que la curva normal se llama as porque es as, es decir, normal, habitual o frecuente. Tambin nos vale pensar en que el nombre indica que la curva sirve para normalizar o estandarizar determinados procedimientos en estadstica. Y tambin es cierto. Pero lo que va a ser normal es que vamos a hartarnos de utilizarla. As que vete acostumbrando.

    Cosas tan curiosas como importantes

    La curva normal tiene algunas caractersticas importantes. Veamos algunas de ellas.

    1. La curva puede variar de posicin a lo largo del eje horizontal, es decir, puede estarms hacia la izquierda o ms hacia la derecha. Esa posicin se representa bien porla media aritmtica. Esto le pasa a todos los conjuntos de datos. Lo peculiar de la curva normal es que la media aritmtica es una de las dos nicas caractersticas que definen la funcin.

    2. Manteniendo la misma escala, la curva puede ser ms ancha o ms estrecha, segn la desviacin tipo de la variable que sigue ese comportamiento normal. En esto tampoco hay nada de particular. Lo relevante es que se trata de la segunda caracterstica de la curva.

    Ya no tiene ms; es decir, conociendo la media y la desviacin tipo, podemos representarla sin necesidad de ms informacin.

    Las caractersticas 1 y 2 permiten concluir que si sabemos que un conjunto de datos se distribuye segn una ley normal y conocemos su media aritmtica y su desviacin tipo, entonces conocemos todos los datos. Por ejemplo, si la variable X se distribuye segn una ley normal (o es normal o sigue una distribucin normal) y tiene elvalor 90 como media aritmtica y 20 de desviacin tipo, entonces sabemos que un 15% de la poblacin tiene puntuaciones comprendidas entre X i = 70 y Xi = 80, que en trminos estandarizados se expresaran respectivamente como Z i = -1 y Zi = -0,5.

    3. La curva es simtrica. En otras palabras: segn un eje de simetra vertical, una de las dos mitades es un reflejo exacto de la otra. Como es simtrica, la media y la mediana coinciden (a ambos lados se encuentra el mismo nmero de datos y el mismo peso). Como solo tiene una moda, le pasa como a todas las distribuciones simtricas unimodales: la moda se encuentra necesariamente en el centro, por lo que tambin coincide con la mediana y con la media.

    4. Muestra agolpamiento en el centro y dispersin hacia los extremos.5. El modo en que se dispersa desde el centro es acelerada, es decir, disminuye con

    rapidez, hasta que llega a un punto de inflexin en que se desacelera. Ese punto

    4

  • es el valor que se encuentra a 1 desviacin tipo a ambos lados de la media. (obviamente, es a ambos lados puesto que la curva es simtrica).

    6. Aproximadamente el 95% de los datos (la gran mayora) se encuentra, como mucho, a 2 desviaciones tipo de la media. El 99% (la inmensa mayora) llega a poco ms de 2,5 desviaciones tipo de distancia.

    Lo habitual es que la curva normal se utilice estandarizada, es decir, que las puntuaciones originales se traduzcan a puntuaciones tipo. Es lo que he hecho en el punto 6 del esquema: que algo est a 2 desviaciones tipo de la media es que muestra una puntuacin tipo de valor 2 (si est por encima de la media) o de valor -2 (si est por debajo).

    Recordemos que las puntuaciones tipo tienen de media 0 y desviacin tipo 1. Esto simplifica bastante la frmula de De Moivre, tal y como hemos visto ms arriba. Como resulta que una curva normal est caracterizada por su media y su desviacin tipo y en la estandarizada estos valores son siempre los mismos y de cuantas interesantes, entoncescualquier conjunto de datos que sea normal puede ser representado por la curva estandarizada, sin necesidad de manejar infinitas curvas, una para cada una de las infinitas combinaciones posibles de valores para la media y la desviacin tipo.

    Para muchos menesteres se utilizan tablas de la curva normal estandarizada, que asocian puntuaciones tipo con probabilidades. Por ello, estas tablas permiten traducir de puntuaciones tipo a probabilidades o de probabilidades a puntuaciones tipo. Por ejemplo, utilizando una tabla podemos saber que el 95% de los datos en una curva normal se encuentran alejados de la media en no ms de 1,96 desviaciones tipo. En otras palabras, en una curva normal, el 95% central de los datos se encuentra entre las puntuaciones estandarizadas de Z = -1,96 y Z = 1,96. Dicho tambin de otro modo: la probabilidad de encontrar en una curva normal datos que se alejen de la media en no ms de 1,96 desviaciones tipo es del 95% o de 0,95.

    Para afianzar estas ideas, veamos algunas reas bajo la curva normal, asociadas avalores concretos de puntuaciones tipo. Para entender bien los grficos, recordemos que las probabilidades se miden como proporciones o tantos por uno, es decir, como porciones de la unidad. As, por ejemplo:

    1. Algo imposible de que ocurra tiene la probabilidad 0.2. Algo que ocurre seguro tiene la probabilidad 1.3. Algo que ocurre la mitad de las veces, tiene de probabilidad 0,5.4. Algo que ocurre un 75% de las ocasiones, tiene una probabilidad de valor 0,75.

    En las siguientes representaciones grficas de reas bajo la curva normal, se muestra el eje horizontal en escala de puntuaciones tpicas. Cada una de las reas coloreadas representa una probabilidad, una proporcin o una porcin de rea que se expresa en el recuadro de su mismo color.

    5

  • Recursos y tablas

    No solo para afianzar estos conocimientos tericos sino tambin porque necesitaremos calcular probabilidades (o frecuencias o reas) a partir de puntuaciones directas o tpicas de una curva normal, o hacer el camino inverso... conviene ponerse manos a la obra y realizar algunos de esos clculos. Inicialmente, este cometido exige calcular reas bajo la curva normal aplicando integrales definidas a la frmula de De Moivre. No te preocupes. Aunque hay personas que disfrutan con ello, supongo que no estu caso. Lo habitual es acudir a tablas impresas y, cada vez con mayor frecuencia, a programas de ordenador. Para ejemplificar ambos procedimientos, vamos a acudir a una tabla que vers al final de este documento y a la hoja informatizada de clculo de Libre Office Calc (de libre distribucin, muy similar al software propietario de Microsoft Excel). Empecemos por este ltimo recurs...

Recommended

View more >