Unidad 5 La Curva Normal

  • Published on
    11-Jun-2015

  • View
    38.545

  • Download
    7

DESCRIPTION

Unidad 5 del curso "Una mirada a travs del lente estadstico".

Transcript

  • 1. 5. Distribucinnormal:Diosamalacurvanormal.Laestadsticaesunacienciasegnlacualtodaslasmentirassetornancuadros. Pitigrilli,escritoritaliano. ObjetivodelaUnidad: Identificar el comportamiento y distribucin de los datos a travs delosconceptosbsicosdelacurvanormalysusderivados. Introduccin. Antesdepodercomenzarconestaunidadtepedimosquerealicesdosejercicios. Resuelveelejercicio1antesdecontinuarleyendo 5.1.Quesladistribucinnormal? Cuando graficamos una variable en forma de histogramas o polgonos de frecuencias y observamos que los datos parecieran asemejar o tener una forma de campana entonces podramos pensar que la distribucin de dicha variable se aproxima a una distribucin matemticaprecisaeimportantedenominadadistribucinnormalo,simplemente,curvanormal.

2. Ladistribucinnormalsedefinecmo:Ladistribucindedatosdecualquiervariablequeasemejenlaformadeuna curvanormal. Lacurvanormalsedefinecmo:Unadistribucintericadelosdatosdeunapoblacin(Pagano,2008).Esuna curvaenformadecampanaquepuedeserdescritaconlasiguienteecuacin: /1 2Importante!Te presentamos la ecuacin nicamente para que conozcas que existe una base matemtica. No te preocupes tratando de descifrar qu significa (al menos para estecurso).Lacurvanormalpuedeserrepresentadacomo: 3. Ahorareflexionaunmomento.PorquelttulodelaunidadsetitulaDiosamalacurvanormal? Para qu estaremos estudiando la unidad? Porque casi todas las variables que puedan ser graficadasenunhistograma(enlanaturalezayenelcomportamientodelhombre)sedistribuyen deestaforma!Peroporqulacurvanormalestancomnenlanaturaleza?Larespuestaaesapreguntaquiznoexista.Sinembargoescuriosocmoesqueprcticamente cualquiercosaquepuedasermedidatieneestatendencia:Laestaturadelaspersonas,supeso,su IQ,lascalificacionesdeunexamen,eltamaolosrbolesdelacuadra,lacantidaddenubesque observo al da, el nmero de hojas de un arbusto, el nmero de cabellos de una persona, las graduacionesdeloslentesdelaspersonas,etctera(ylalistapodracontinuar).Paratratardeexplicarloadetalletomemos,porejemplo,lacantidaddeletraselegidasalazarque determinadapersonapuederecordar.Enalgunaspruebas,lacantidaddeletrasrecordadaspuede seralta,enotras,baja,yenlamayora,lascantidadessernintermedias.Esdecir,esprobableque la cantidad de letras elegidas al azar que una persona pueda recordar en diversas pruebas siga aproximadamentelaformadeunacurvanormal.Sin embargo, en alguna prueba en particular, el nmero real recordado se ver afectado por diversascircunstancias,talescomoruidoenlahabitacin,estadodenimodelapersonaenese momento,unacombinacindeletrasconfundidasinconscientementeconalgnnombrefamiliar, unasecuenciadeletraselegidasalazarqueresultasercasisiemprelamismaletra,etc.As, en general, la persona recuerda una cantidad media, una cantidad en la que todas las circunstancias contrapuestas se cancelan entre s, y por eso son mucho menos comunes las cantidadesmuyaltasomuybajasdeletrasrecordadas.Estocreaunadistribucinqueesunimodal,esdecir,lamayoradeloscasosestncercadelmedio y los menos estn en los extremos. Tambin crea una distribucin que es simtrica, porque cualquiervalorpuedeestartantoporarribacomopordebajodelmedio(lapodemosdoblarporla mitadyambosladosseranidnticos). 4. Lascaractersticasquedebeposeerunadistribucindedatosparaformarunacurvanormales:a. Unimodalidad:Sloexisteunasolamoda.Nohaymsdeunapuntuacinmsfrecuente. b. Simtrica:Sipartisemosalamitadlacurva,ambosladossonidnticos. 5. c. Mesocrtica:Lacurvanoesnimuyaplanadanimuypuntiaguda. d. Asinttica: Los dos extremos de la curva jams tocan el eje de las X. Esto permite quesiempreexistelaposibilidaddetoparnosconunvalormsaltoomsbajo. 6. e. Lamedia,lamedianaylamodaposeenlosmismosvaloresyseencuentranalcentrodelacurva(ladividenendos). Resuelveelejercicio2antesdecontinuarleyendo 7. 5.2. Ladesviacinestndarylavarianza. Imaginemosunmontculodearena: Ahorapensemosenlacantidad dearenaque existe.Conforme msnosacercamosalcentrode estemsaltoesy,mientrasnosalejamosmsdelcentroynosvamosalasorillaslacantidadde arena disminuye y tiene menor altura. Si dijramos que el montculo de arena mide de punta a punta1metropodramosafirmarlosiguiente:Siextrajsemos30centmetrosdearenadelcentro del montculo y extrajramos 30 centmetros de un extremo del montculo y pesramos ambas muestras, veramos que la cantidad de arena sera muy diferente; la arena del centro pesara muchomsquelapocaarenaextradadelaorillas.De igual forma que con la arena, la altura de una distribucin de datos indicara la cantidad de casosqueobtuvieronundeterminadovalor.Entremsnosacerquemosalcentrodelacurva,ms 8. casos encontraremos y viceversa; entre ms nos alejemos del centro de la curva, menos casos existirn.Sin dejar a un lado la analoga de la arena podramos decir que en lugar de hablar de centmetros, para la distribucin de datos existen desviaciones estndares. Las desviaciones estndaresseranloscentmetrosapartirdelcentrodelmontculodearena Ladesviacinestndarsedefinecmo:Lamedidaempleadaparaindicarqutanlejosesteldatoenbrutocon respectoalamediadesudistribucin(Pagano,2008).Ladesviacinesrepresentadaporunasenelcasodequeseacalculadaparala muestrayunasigma()enelcasodeunapoblacin.Lafrmuladeladistribucinestndar(paramuestras)es: 1Dondeneseltotaldesujetosyxeselvalordeunavariableparacadasujeto.EnSPSSladesviacinestndarsecalcula: a. Ingresarlosdatosdeunavariableydarformato.b. Darclicenanalizar,estadsticadescriptiva,frecuencias.c. Seleccionarlasvariablesenlasquesecalcularladesviacinestndar alcuadrodevariables.d. Darclicenelsubmenestadsticasyseleccionardesviacin estndaryvarianza.e. Darclicenaceptar. 9. Observalasiguientefigura:Enlaimagenanteriorsehadibujadounacurvanormal.Enestecasosetratadeunacurvaque representadatosobtenidosdeunapoblacin1.Lamediaestubicadaalcentrodelacurva()ylas lneasdibujadasacadaladosonloscentmetrosconrespectoalamedia.Esposibleafirmarque lalneadelextremoizquierdoeslamediamenosunadesviacinestndarylalneadelextremo derechoeslamediamsunadesviacinestndar.AhorasurgelapreguntaParaqusirveesto? 1Estolosabemosporquelossmbolossongriegosyportantoaludenaparmetrosynoaestadsticos, recuerdalaunidadsobrelosconceptosbsicosdelaestadstica. 10. Resuelveelejercicio3antesdecontinuarleyendo Observalassiguientesimgenes: Sinuevamenteempleramoslaanalogadelmontculodearenaeimaginramosquetodalaarena pesa100gramosentoncespodramosdecirqueaunadesviacinestndaraladerechadelcentro delmontculoencontraramos34gramosdearena(observalosporcentajesdelaimagenanterior), sipesramoslaarenadeunaadosdesviacionesestndaresencontraramos14gramosdearenay 11. si pesramos la arena de dos a tres desviaciones estndares encontraramos 2 gramos aproximadamente.Sirecordamoslapropiedaddesimetradelacurvanormal(unladoesidnticoalotro)podramos pensarquedelladoizquierdodelmontculodearenahabralasmismasdistribucionesdelaarena. Notacomosisumamoslosporcentajesdeunsololadodelmontculodearenaencontramos50 gramosdelaarenadeunladoy50gramosdelotrolado(entrelosdosladossuman100gramos queesloqueoriginalmentepesabanuestromontculo).Si lo trasladramos a cualquier distribucin de datos diramos algo similar A ms o menos 1 desviacin estndar se encontraran el 34% de los casos; de ms o menos 1 a 2 desviaciones estndar estaran cerca del 14% de los datos y de ms o menos 2 a 3 desviaciones estndar estaranaproximadamenteel2%deloscasos.Deigualformapodemoshacercombinacionesconlosporcentajesqueconocemos: 68% 12. 72% 84% 13. 98% Asimismosernecesariodefinirdosconceptosquesonmuymencionadosentrelosinvestigadores delascienciassocialesquerespondenalassiguientespreguntas:Entrequrangodelaescalaes fcilqueencuentrealossujetosdemimuestra(sujetostpicosonormales)?Entrequrangode laescalaesdifciloinfrecuenteencontrarasujetosdemimuestra(casosatpicosoanormales? Loscasostpicossedefinencmo: Loscasosqueseencuentranaunadesviacinestndardelamedia. Elrangodecasostpicosseobtienendesumaryrestarunavezladesviacin estndaralamedia. Loscasostpicossonaquellosqueseencuentranenunrangoqueabarqueal68%se lossujetos(1s). 14. Loscasosatpicossedefinencmo: Loscasosqueseencuentranmsdetresdesviacionesestndardelamedia. Elrangodecasostpicosseobtienendesumaryrestartresvecesladesviacin estndaralamedia.Todosloscasosqueseencuentrenafueradeesterangoson casosatpicosononormales. Loscasosatpicossonaquellossemuestranfueradeunrangoqueabarqueel 99.9%deloscasos(3s)(recuerdaquelacurvaesasinttica,siemprehay posibilidaddeunvalormenoromayorenlaescala;apesardequelosporcentajes delasgrficasmostradassumen100%siemprepuedeescaparsealgnsujeto).Resuelveelejercicio4antesdecontinuarleyendoY qu es eso de varianza? Generalmente no se encontrarn en los reportes de cualquier investigacin el trmino de varianza (cuando se trata de medidas de dispersin). La varianza simplementeeselresultadodeelevaralcuadradoladesviacinestndar. Importante!Lavarianzanopuedeserinterpretadacomomedidadedispersindelosdatos. Laexistenciadelavarianzasedebeadosmotivosprincipales: a. Permite que algunas frmulas estadsticas sean ms exactas (cosa de matemticos).b. La varianza es til en anlisis estadsticos ms complejos que buscan explicarunavariableAatravsdeunaB. 15. 5.3.NocionesdelteoremadeChevichev. Pafnuti Chebyshov, Tchebychev, Tchebycheff, Tschebyscheff o ebiev era el nombre del personajequeobservamosenlaimagenanterior.Elhechodequetengatantosnombressedebea quecadaunoesunintentodetraduccindesuapellidodelruso(). Sin embargo, la complejidad del apellido no es lo que nos interesa. Lo interesante de este matemticoeselteoremaquepropusoqueenresumendicelosiguiente: ElteoremadeChevichevindicaquecuandolosdatossecomportancomouna distribucinnormal: a. Aproximadamenteel68%delapoblacinestdentrode1s.b. Aproximadamenteel95%delapoblacinestdentrode2s.c. Aproximadamenteel99%delapoblacinestdentrode3s.El fin de mencionar este teorema es nicamente el hacer notar que existen diferentes teoras y propuestassobreelnmerodedatosqueseencuentranandesviacionesestndarcuandostos (losdatos)secomportandecmounadistribucinnormal.Sicomparramoslosporcentajesantes estudiadosylosdelteoremadeChevichevveramosquesonmuysimilares. 16. 5.4.Laspuntuacionesestandarizadas. Parafinalizarconestaunidadesnecesariorevisarelconceptodepuntuacionesestandarizadas quetambinsonconocidascomopuntajesZ. UnapuntuacinestndaropuntajeZsedefinecmo:Undatotransformadoqueindicaacuntasunidadesdedesviacinestndarpor encimaopordebajodelamedia,seencuentraundatoenbruto(Pagano,2008). Cuandonosotrosqueremosdeterminardeformamsexactaacuntasdesviacionesestndarse encuentraunsujetoestonospermitecompararlocontralanorma(contratodoslossujetosque fueron analizados). Podemos decir que un sujeto se encuentra a ms o menos n nmero de desviacionesestndardelamedia. Paratransformarundatoapuntuacionesestndaresseaplicalasiguientefrmula(Pagano, 2008): Dondexeseldatoquequeremosconvertir,lamediaseobtienedelapoblacinomuestra estudiadaylasesladesviacinestndardelapoblacinomuestraestudiada.De igual forma que con lo revisado en los subtemas anteriores, que un sujeto se encuentre a menosde1sindicaraqueesuncasotpico.Siunsujetoseencuentraa1sentoncesesuncaso menosfrecuenteysielsujetoseencuentraa3sesuncasoatpico.Ensntesislautilidaddelas puntuaciones Z es el permitirnos precisar exactamente a cuntas desviaciones estndar se encuentraundatodelamedia.Porejemplo ElcasodelprofesorbarcoyelprofesorestrictoImaginemos que estamos comparando las calificaciones de los estudiantes. En una materia conunprofesorbarcopodrapensarsequetodoslosalumnosobtienenaltascalificaciones mientrasqueenunamateriaconunprofesoestrictoexistiramuchadiversidad.Conelfin de ejemplificar diremos que la materia con un profesor barcoes Historia mientras que el profesorestrictoeselqueimparteLiteratura. 17. Elcasodelprofesorbarcoyelprofesorestricto(continuacin)As,sienHistoriatodoslosalumnosobtienenmsde9decalificacinnoseraapropiado compararlacalificacindeestamateriacontraotralasdeLiteratura;dondemenosdela mitaddelosestudiantesobtienen6.Sinembargo,laspuntuacionesestandarizadassnos permiten comparar las dos calificaciones puesto que no se compara a maestro, la dificultad de los contenidos o la forma de la evaluacin. Simplemente se compara al alumnocontraeldesempeodesuscompaeros:No es posible decir: Pedro sac 9 en la Historia pero sac 7 en la Literatura. Por tanto PedroesunexcelentealumnodelaHistoriayunpsimoalumnoenLiteratura.S es posible decir: Pedro se encuentra a 0.8 desviaciones estndar del promedio en la Historiayseencuentraa+1.7desviacionesestndardelamediaenlaLiteratura.Portanto PedroesmuybuenestudianteenlamateriadeLiteraturaacomparacindesusalumnos peronecesitamejorarenlaHistoria. 18. Ahora bien, tambin es posible a travs del uso de las puntuaciones estndar, identificar los rangosprecisosenlosqueseencuentraelX%deunamuestra.Observalasiguientetabla2 Si observas a detalle, para cada valor Z existe un porcentaje. Si vamos al valor Z de 2.00 el porcentajeindicadoesde0.022753.Estoindicaraquedemenosinfinitodesviacionesestndara menos dos desviaciones estndar se encuentra el 2.27% de los sujetos. De igual forma, si buscamoselvalorZde+1.00elporcentajeindicadoesde0.841344queindicaqueel84.13%de lossujetosseencuentrasdemenosinfinitodesviacionesestndaramsunadesviacinestndar. 2 Obtenidadehttp://www.uv.es/~meliajl/Docencia/Tablas/ZColaIzq.PDF 3 Marcadoconunaroazulenlatabla. 4 Marcadoconunaroverdeenlatabla. 19. SiyoquisieraconocerelporcentajedesujetosqueseencuentraentredosvaloresZ,simplemente resto al porcentaje mayor el menor: para conocer el porcentaje de sujetos que se encuentran entre2.00y+1.00desviacionesslohabraquerestar84.13%2.27%quedara81.86%.Resuelveelejercicio5antesdecontinuarleyendo