miércoles, 13 de noviembre de 2013

Medidas de tendencia Central y Variación


A veces, de los datos recolectados ya organizados en alguna de las formas vistas en capítulos anteriores, se desea encontrar una especie de punto central en función de sus frecuencias. En Estadística se conocen tres diferentes, llamadas medidas de tendencia central, cuya utilización varía de acuerdo con lo que se desee del conjunto de datos recolectados.

Esas tres medidas de tendencia central son la media, la mediana y la moda. Cada una de ellas se estudiará en dos partes: primero, cuando los datos están organizados en tablas de distribución de frecuencias simple y, segundo, cuando están organizados en intervalos. Además, a veces difieren las fórmulas para calcular alguna de ellas si se trata de poblaciones o de muestras. En caso de que no se diga nada, deberá entenderse que la fórmula es la misma para ambas.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.1 En este caso se incluyen también los cuantíales entre estas medidas.

Entre las medidas de tendencia central tenemos:

* Media.

* Media ponderada.

* Media geométrica.

* Media armónica.

* Mediana.

* Moda.


Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está observando, en este caso se observan variables cuantitativas.

Las tres principales medidas de tendencia central son:

• La media aritmética
• La moda
• La mediana

Media

Nombre Cotidiano: Promedio

Fórmula:
¿Qué es?
Es el valor característico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muestrales.

¿Para qué se utiliza?
 Es un método para obtener la tendencia central de un espacio muestral. El término “media aritmética” es preferido en las matemáticas y la estadística porque ayuda a distinguirlo de otros medios como la geométrica y media armónica.

Además de las matemáticas y la estadística, la media aritmética se utiliza con frecuencia en campos como la economía, la sociología y la historia, a pesar de que se utiliza en casi todos los campos académico, hasta cierto punto. Por ejemplo, el PIB per cápita da una aproximación de la renta media aritmética de la población de un país.
Mientras que la media aritmética es a menudo utilizado para comunicar las tendencias centrales, no es una estadística robusta, lo que significa que está fuertemente influenciado por los valores extremos. En particular, para las distribuciones sesgadas, la media aritmética no puede acuerdo con la propia noción de centro “, y robusto estadísticas”, como la mediana puede ser una mejor descripción de la tendencia central.

Ejemplo: Las calificaciones de Matemáticas de los grupos “A” y “B” se muestran en la tabla. Calcular el promedio (la media) obtenido por esos grupos.


Solución: Debe añadirse a la tabla original una columna encabezada por fx en donde se anotarán los resultados correspondientes a las multiplicaciones de cada valor nominal x por su frecuencia f respectiva.
Por ejemplo, para la primera fila de la tabla: fx = 2 × 0 = 0
La tabla completa con las tres columnas queda como se muestra a la derecha.
La suma de los valores de la columna fx es 544, de manera que utilizando la fórmula para el promedio, recordando que n es la suma de todas las f, se obtiene:


Mediana
Nombre Cotidiano: Valor medio
Fórmula:



Para el cálculo de la mediana en datos agrupados se utiliza la siguiente formula:



Identificación:



¿Qué es?

Es la medida de tendencia central que se define como aquel valor nominal que tiene, dentro de un conjunto de datos ordenados, arriba y abajo de él, el mismo número de datos nominales. En otras palabras, es el dato que está a la mitad, es el dato que divide en dos partes iguales a un conjunto de datos.
La mediana se puede calcular tanto para variables cardinales como ordinales, y es la que más se utiliza para variables ordinales. Es menos operativa que la media desde el punto de vista matemático. No es tan informativa como la media, ya que en su cálculo interviene sólo el orden de los valores y no su magnitud. Sin embargo, por este mismo motivo no está influenciada por la magnitud de los valores extremos (es una medida robusta) y por eso, se puede utilizar cuando la media no sea representativa

¿Para qué se utiliza?
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:



Moda

Nombre Cotidiano: Mayor Repetición
Fórmula
Símbolo: Mo
Para obtener la moda en datos agrupados se usa la siguiente fórmula:


Identificación:


¿Qué es?
Es la medida de tendencia central que se define como aquel valor nominal que tiene la frecuencia mayor. Por lo tanto, una distribución de frecuencias puede tener más de una moda o, inclusive, no tener moda cuando todos los datos tienen frecuencia 1
¿Para qué se utiliza?
Nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien sería la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal.

Ejemplo:




Medidas de Variabilidad
Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central. Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.

Rango

Nombre cotidiano: Amplitud o recorrido

 Se define como la diferencia existente entre el valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular. El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la que proporciona menos información. Además, esta información puede ser errónea, pues el hecho de que no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad. Está determinado por los dos valores extremos de los datos muéstrales, es simplemente la diferencia entre la mayor y menor observación. Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.

Requisitos del rango
·         Ordenamos los números según su tamaño.
·         Restamos el valor mínimo del valor máximo


Ejemplo
Para una muestra (8, 7, 6, 9, 4 ,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de:

El rango se obtiene dividiendo el número mayor con el menor de los datos estadísticos

Medio rango o rango medio
El medio rango o rango medio de un conjunto de valores numéricos es la media del mayor y menor valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

Ejemplo

Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la correspondiente fórmula sería:

Representación del medio rango:

Varianza

Formula:
La varianza se representa por 




Identificación:


¿Qué es?
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

Propiedades de la varianza

1.-La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2.-Si a todos los valores de la variable se les suma un número la varianza no varía.
3.-Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
4.-Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:


Observaciones sobre la varianza

1.-La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2.-En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

No hay comentarios: