. Interpretación de los Gráficos de Caja en el Análisis Descriptivo e Inferencial.

marzo 30th, 2015
Anterior Entrada Siguiente Entrada

Curso Estadística Online en Ciencias de la Salud

Los gráficos de caja (Box Plots) fueron originalmente desarrollados por M.E. Spear, permiten conocer cómo se distribuyen los datos dentro de una variable. A diferencia de los histogramas que requieren un tamaño de muestra de al menos 30 casos para ser útiles, los gráficos de caja pueden ser construidos con tan solo 5 casos y aportan más detalles acerca de las colas de la distribución. Representan la información que se observa en la figura:

Diagrama de Caja (Fuente: Wikipedia)

  1. Mediana. Valor que deja a la mitad de los casos por encima y a la otra mitad por debajo.
  2. Primer Cuartil (Q1). El 25% de los casos se encuentran por debajo de este valor.
  3. Tercer Cuartil (Q3). El 75% de los casos se encuentran por encima de este valor.
  4. Rango Intercuartílico (RIC). Es la diferencia entre el tercer y el primer cuartil.
  5. Límites Superior o Inferior (Ls o Li). Ls contiene los casos por encima de Q3 más 1,5 veces el rango intercuartílico o Li por debajo de Q1 – 1,5xRIC (Estilo de Tukey). Cuando los valores no son posibles en lugar de emplear la aproximación anterior se escogen los valores máximo o mínimo de la muestra (Estilo de Spears).
  6. Los valores atípicos son aquellos que están más a allá de los límites inferior y superior. Cuando los valores atípicos están más allá de 3 veces el RIC en lugar del 1.5 son denominados valores extremos.

Los diagramas de caja son especialmente útiles cuando la distribución de una variable es asimétrica o se aleja de la distribución normal. En este tipo de casos interpretar una variable en función de su media o desviación estándar es un error puesto que estos estimadores no describen fielmente las características de nuestra muestra. En algunas ocasiones, cuando la muestra es lo suficientemente grande, se dibujan unas muescas dentro de los cuadrados que representan los intervalos de confianza al 95% para la mediana. Con estas muescas podemos evaluar si las diferencias entre dos variables son significativas si las muescas no se superponen entre ambas variables.

A la izquierda se muestra un gráfico de caja normal y a la derecha con muescas con las cuales realizar una interpretación inferencial.

A la izquierda se muestra un gráfico de caja normal y a la derecha con muescas con las cuales realizar una interpretación inferencial.

En el siguiente enlace puedes encontrar una herramienta online gratuita para dibujar tus propios diagramas de caja. http://boxplot.tyerslab.com/

Si quieres aprender estadística de forma práctica te aconsejamos nuestro curso online con más de 14 horas de videotutoriales y prácticas con SPSS.

Si tienes alguna pregunta, duda o comentario puedes realizármela en nuestro muro de facebook:

Captura de pantalla 2013-07-06 a las 21.31.45

 

Tags: ,

14 comments on “Interpretación de los Gráficos de Caja en el Análisis Descriptivo e Inferencial.”

José Manuel dice:

Hola gusto en conocerlos. En principio felicidades por la información y la pagina sobre los gráficos de cajas y bigotes.
Les escribo con el objeto de preguntar sobre el tema.
Para hacer una inferencia cuando se utilizan los gráficos de cajas y bigotes con muesca. ¿El significado es que cuando se solapan o sobreponen las muescas de las cajas existen diferencias entre las muestras?
Gracias.

Manuel Rodríguez dice:

Buenas José Manuel

Si las muescas de las cajas de ambas variables NO se solapan significará que existen diferencias significativas entre las medianas de ambas variables.

Saludos

Jimmy Alejandro Ramirez Martinez dice:

Cordial saludo.

Me animé a escribir porque sentí inmediatamente la compresión que tienen en el caso del diagrama de cajas y bigotes.

Pero una pregunta me inquieta.

He visto diagrama de cajas, donde el bigote o cola no esta fuera de la caja sino dentro. ¿En qué casos puede esto darse?

Gracias por la atención; quedo a la expectativa.

Manuel Rodríguez dice:

Buenas Jimmy,

Me alegro de que el artículo te haya servido de ayuda. Es importante diferenciar que hay dos estilos de box-plot, el desarrollado originariamente por M.E. Spear que establecían como bigotes superior e inferior los valores mínimo y máximo de los datos y el de Tukey descrito en este artículo. Es muy posible que algunos software utilicen la configuración de Spear y algún mínimo o máximo se encuentre dentro de la caja. Esta puede ser la explicación de lo que has visto.

Saludos

José Manuel dice:

Hola, gracias por la respuesta. Sin embargo, aún no entiendo el por que si no se solapan las muescas habría diferencias significativas. Pues si no se solapan entonces donde radica la diferencia pues las dos medianas se encontrarían dentro del margen de aceptación. Me parece matemáticamente lógico considerar que si se solapan las muescas entonces si hay diferencias significativas entre las medias puesto que se saldrían del margen de aceptación. Con base en lo anterior me podría usted a clarificar la duda? Gracias.

José Manuel dice:

ok entendido, no hagan caso al mensaje anterior
Muchas Gracias!!!!

Que pasa si el 25% de los datos es mayorìa que la segunda o el primer cuartil es mayor que el segundo como se interpretaría eso en un problema

Respondeme porfavor porque no entiendo esa parte en el diagrama de caja y bigotes

Manuel Rodríguez dice:

Estimado Adolfo,

Siento no poder responder a tu pregunta ya que no la termino de entender.

Saludos

Carla dice:

Hola, estoy haciendo un trabajo para la universidad y el límite inferior me sale en negativo. Es posible?

Manuel Rodríguez dice:

Buenas Carla, si tus datos contienen valores negativos el límite inferior puede aparecer en negativo.

Saludos

Carla dice:

Mis datos no tienen datos negativos. Tengo un rango de 1 a 14

Laura dice:

¡Auxilio! ¿cómo puedo analizar un diagrama en el que el límite superior está dentro de la caja?. Me explico; la caja comprende desde 0 hasta -0.018 y el límite superior está en 0.08 y el inferior en -0.28.

Manuel Rodríguez dice:

Buenas Laura, mi primera recomendación es que pruebes a utilizar otro software, algunos software cometen errores al dibujar los diagramas de cajas. De todas formas será un placer poder resolver tus dudas de estadística a través de nuestro curso de estadística con SPSS de Qvision Academy http://www.cursoestadisticaonline.com que es el medio que utilizamos habitualmente para resolver las consultas de nuestros alumnos.

Deja un comentario

Tu email no se publicará.(Campo obligatorio)