Definición de estadística descriptiva

Definición de estadística descriptiva
Las estadísticas descriptivas describen y resumen los datos de forma que proporcionan una comprensión general de las características dominantes de los datos.

Definición de estadística descriptiva

Imagine que está interesado en medir el nivel de ansiedad de los estudiantes universitarios durante la semana de los exámenes finales en uno de sus cursos. Pide a 11 participantes en el estudio que califiquen su nivel de ansiedad en una escala del 1 al 10, siendo 1 «sin ansiedad» y 10 «extremadamente ansioso». Recoge las puntuaciones y las revisa. Las puntuaciones son 8, 4, 9, 3, 5, 8, 6, 6, 7, 8 y 10. Tu profesor te pide un resumen de tus conclusiones. ¿Cómo puedes resumir estos datos? Una forma de hacerlo es utilizando la estadística descriptiva.

Los estadísticos descriptivos se utilizan para describir o resumir los datos de forma que sean significativos y útiles. Por ejemplo, no sería útil saber que todos los participantes de nuestro ejemplo llevaban zapatos azules. Sin embargo, sí sería útil saber la dispersión de sus índices de ansiedad. La estadística descriptiva es la base de todo análisis cuantitativo.

¿Cómo se describen los datos? Hay dos formas: las medidas de tendencia central y las medidas de variabilidad, o dispersión.

Medidas de tendencia central

Probablemente esté algo familiarizado con la media, pero ¿sabía que es una medida de tendencia central? Las medidas de tendencia central utilizan un único valor para describir el centro de un conjunto de datos. La media, la mediana y la moda son las tres medidas de tendencia central.

La media, o promedio, se calcula hallando la suma de los datos del estudio y dividiéndola por el número total de datos. La moda es el número que aparece con mayor frecuencia en el conjunto de datos.

La mediana es el valor medio de un conjunto de datos. Se calcula enumerando primero los datos en orden numérico y luego localizando el valor en el centro de la lista. Cuando se trabaja con un conjunto de datos impares, la mediana es el número central. Por ejemplo, la mediana en un conjunto de 9 datos es el número que ocupa el quinto lugar. Cuando se trabaja con un conjunto de datos pares, se encuentra la media de los dos números del medio. Por ejemplo, en un conjunto de datos de 10, se encuentra la media de los números en el quinto y sexto lugar.

La media y la mediana sólo pueden utilizarse con datos numéricos. La moda puede utilizarse tanto con datos numéricos como nominales, o con datos en forma de nombres o etiquetas. El color de los ojos, el sexo y el color del pelo son ejemplos de datos nominales. La media es la medida de tendencia central preferida, ya que tiene en cuenta todos los números de un conjunto de datos; sin embargo, la media es extremadamente sensible a los valores atípicos, o valores extremos que son mucho más altos o bajos que el resto de los valores de un conjunto de datos. La mediana es preferible en los casos en los que hay valores atípicos, ya que la mediana sólo tiene en cuenta los valores medios.

Sabiendo lo que sabemos, calculemos la media, la mediana y la moda utilizando el ejemplo de antes. De nuevo, los índices de ansiedad de tus compañeros son 8, 4, 9, 3, 5, 8, 6, 6, 7, 8 y 10.

  • Media: (8+ 4 + 9 + 3 + 5 + 8 + 6 + 6 + 7 + 8 + 10) / 11 = 74 / 11 = La media es 6,73.
  • Mediana : En un conjunto de datos de 11, la mediana es el número que ocupa el sexto lugar. 3, 4, 5, 6, 6, 7, 8, 8, 8, 9, 10. La mediana es 7.
  • La moda: El número 8 aparece más veces que cualquier otro número. La moda es el 8.

Medidas de dispersión

Ahora tenemos unos números bastante sólidos en nuestros datos, pero digamos que queremos ver la dispersión de los datos del estudio a partir de un valor central, es decir, la media. En este caso, se buscarían medidas de dispersión, que incluyen el rango, la varianza y la desviación estándar.

La medida de dispersión más sencilla es el rango. Nos indica la dispersión de nuestros datos. Para calcular el rango, se resta el número más pequeño del número más grande. Al igual que la media, el rango es muy sensible a los valores atípicos.

La varianza es una medida de la distancia media a la que se encuentra un conjunto de datos con respecto a su media. La varianza no es una estadística independiente. Se suele utilizar para calcular otros estadísticos, como la desviación estándar. Cuanto mayor sea la varianza, más dispersos estarán los datos.

Hay cuatro pasos para calcular la varianza:

  • Calcular la media.
  • Resta la media de cada valor de los datos. Esto te indica a qué distancia se encuentra cada valor de la media.
  • Eleva al cuadrado cada uno de los valores, de modo que ahora tengas todos los valores positivos, y luego halla la suma de los cuadrados.
  • Divide la suma de los cuadrados entre el número total de datos del conjunto.

Vídeos de Definición de estadística descriptiva

Contenido