12.174 cursos gratis
8.742.855 alumnos
Facebook Twitter YouTube
Busca cursos gratis:

Capítulo 46:

 Procedimiento Explore. Estadísticas descriptivas cruzando grupos

Análisis de datos: El procedimiento Explore

La exploración de los datos ayuda a determinar si las técnicas de la ciencia estadística que usamos son o no apropiadas; para eso disponemos del procedimiento Explore.

El procedimiento Explore nos provee de resúmenes visuales y números de los datos, ya sea para todos los casos por separado o ya para grupos de casos.

La variable dependiente a ser analizada debe ser una variable de escala.

Las de grupo pueden ser nominales u ordinales.

Con Explore podemos obtener los diagramas de caja, identificar los outliers, chequear los supuestos y las diferencias entre los grupos.

Estadísticas descriptivas cruzando grupos

Tomemos el siguiente ejemplo; las cosechas de maíz deben ser testadas para establecer si hay o no el elemento aflatoxin, un veneno cuya concentración varía entre las cosechas.

Una firma que procesa granos ha recibido 8 diferentes cosechas, pero la distribución de aflatoxin, en partes por billón, debe ser estimada antes de que el maíz sea aceptado.

Este ejemplo usa el archivo aflatoxin.sav cuyos datos consisten en 16 muestras de cada una de las entrega de las ocho en que se han transado la operación.

Menú principalAnalizar → Etadísticas Descriptivos → Explore Aflatoxin PPB como la variable dependiente y Corn Yield como la variable de factor → Aceptar

En la pantalla de resultados tenemos el cuadro general para las 8 entregas (Yields) y las 16 muestras que se ha elegido de cada una.

Luego nos da la tabla con los estadísticos respectivos para cada una de las 8 entregas.

Los cuadros son muy extensos para copiarlos, pero podemos analizarlos.

Así mismo, nos despliega la distribución “Tallos y Hojas” la que será estudiado en el apartado próximo; finalmente nos diseña los diagramas de caja.

De acuerdo con los términos del ejemplo, el límite establecido acepta como máxima una proporción de 20 unidades  de aflatoxin por billón.

Para interpretar los resultados, debemos obtener la tabla pivoteada, para lo cual activamos la tabla haciendo click en cualquier lugar dentro de sus límites.

La tabla pivoteada nos muestra que, de acuerdo con la media, sólo las entregas 4, 7 y 8 caen por debajo de las 20 unidades por billón establecidos.

También aparecen los Diagramas de Caja para cada una de las muestras, cuyo concepto ya fue analizado en el anterior acápite.

En este caso, los valores extremos merecen una atención especial.

Ya lo dijimos, la línea gruesa dentro de una caja marca la Mediana de la distribución, que es también el percentil 50 de esa misma distribución.

Ejemplo, la Mediana del nivel de  aflatoxin en el grupo 1 es 21.50 por billón.

Observemos que las medianas varían considerablemente entre los diagramas de caja.

Sabemos la longitud de cada caja, no la de los whiskers, marcan el percentil 25 y el percentil 75 de cada distribución.

Para el grupo 2, v.g, el valor inferior de la caja es de 24.75 y el valor superior 36.75.

Recordemos que estos valores registran los que están incluidos en la caja misma (hinges) desde la base hasta la línea que cierra el rectángulo; aún no hablamos de los whiskers.

Los whiskers aparecen encima y debajo de los límites de las cajas, es decir, por encima y debajo de los hinges; para el grupo 2 el valor mínimo es 22 y el máximo es 52.

Gráfico 7.7

Estadística descriptiva. Cruzando grupos

Los valores outliers, están identificados con la letra mayúscula “O”.

El grupo 2 tiene un valor outlier de 68 y está etiquetado con 20

Esto nos dice que el elemento número 20 de la muestra tiene un valor de 68, es decir, un valor por encima de los demás; es un outlier.

El grupo 5 tiene un valor outlier de 49, etiquetado con 71, lo que nos indica que el elemento número 71 de la muestra tiene un valor 49, que está por encima de los demás

Las etiquetas representan al número de fila en la pantalla de dato; compruébese que en la fila 20, el valor del elemento es 68; lo mismo en la fila 71 para el valor outlier 49

Los valores extremos son identificados con asterisk (*)

No hay valores extremos en estos datos.

Se puede comparar los valores del diagrama de caja con los que muestra la Mediana en el cuadro de Estadísticos.

El uso de Explore nos permitió crear una tabla que muestra los estadísticos, a través de los cuales nos enteramos que el nivel de alfatoxin no son seguros para 5 de los 8 grupos.

Esto fue confirmado por los diagramas de caja; el procedimiento Explore ofrece muchas opciones que permiten una mirada de mayor detalle.

De ese modo logramos una imagen más adecuada en cuanto a la forma cómo difieren los grupos, tanto entre sí, como de algún valor estadísticamente esperado.

La identificación de valores atípicos, es decir, extremos para arriba o para abajo, es de gran ayuda cuando se trata de medir muestras no influidas por valores extremos.

Nuestras novedades en tu e-mail

Escribe tu e-mail:



MailxMail tratará tus datos para realizar acciones promocionales (vía email y/o teléfono).
En la política de privacidad conocerás tu derechos y gestionarás la baja.

Cursos similares a Estadística aplicada con SPSS. Módulo I



  • Vídeo
  • Alumnos
  • Valoración
  • Cursos
1. Estadística aplicada a la educación. Investigación pedagógica
La Estadística aplicada a la educación tiene un área específica de estudio sobre... [26/05/10]
6.726  
2. Psicología aplicada al trabajo. España: los grandes maestros
La psicología del trabajo o la psicología aplicada a la orientación... [18/03/10]
602  
3. Tabla de distribución de frecuencias para datos agrupados. Estadística
En el presente vídeotutorial, en matería de Estadística , estudiamos las... [09/11/12]
5
Curso con video

Capítulos del curso


¿Qué es mailxmail.com?|ISSN: 1699-4914|Ayuda
Publicidad|Condiciones legales de mailxmail