A veces, de los datos recolectados ya organizados en alguna de las formas vistas en capítulos anteriores, se desea encontrar una especie de punto central en función de sus frecuencias. En Estadística se conocen tres diferentes, llamadas medidas de tendencia central, cuya utilización varía de acuerdo con lo que se desee del conjunto de datos recolectados.
Esas tres medidas de tendencia central son la media, la mediana y la moda. Cada una de ellas se estudiará en dos partes: primero, cuando los datos están organizados en tablas de distribución de frecuencias simple y, segundo, cuando están organizados en intervalos. Además, a veces difieren las fórmulas para calcular alguna de ellas si se trata de poblaciones o de muestras. En caso de que no se diga nada, deberá entenderse que la fórmula es la misma para ambas.
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.1 En este caso se incluyen también los cuantíales entre estas medidas.
Entre las medidas de tendencia central tenemos:
* Media.
* Media ponderada.
* Media geométrica.
* Media armónica.
* Mediana.
* Moda.
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está observando, en este caso se observan variables cuantitativas.
Las tres principales medidas de tendencia central son:
• La media aritmética
• La moda
• La mediana
Media
Nombre Cotidiano: Promedio
Fórmula:
¿Qué es?
Es el valor característico de una
serie de datos cuantitativos objeto de estudio que parte del principio de la
esperanza matemática o valor esperado, se obtiene a partir de la suma de todos
sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo
uno de los principales estadísticos
muestrales.
¿Para qué se utiliza?
Es un método para obtener la tendencia central de un espacio
muestral. El término “media aritmética” es preferido en las matemáticas y la
estadística porque ayuda a distinguirlo de otros medios como la geométrica y
media armónica.
Además de las matemáticas
y la estadística, la media aritmética se utiliza con frecuencia en campos como
la economía, la sociología y la historia, a pesar de que se utiliza en casi
todos los campos académico, hasta cierto punto. Por ejemplo, el PIB per cápita
da una aproximación de la renta media aritmética de la población de un país.
Mientras que la media
aritmética es a menudo utilizado para comunicar las tendencias centrales, no es
una estadística robusta, lo que significa que está fuertemente influenciado por
los valores extremos. En particular, para las distribuciones sesgadas, la media
aritmética no puede acuerdo con la propia noción de centro “, y robusto
estadísticas”, como la mediana puede ser una mejor descripción de la tendencia
central.
Ejemplo:
Las calificaciones de Matemáticas de los grupos “A” y “B” se muestran en la
tabla. Calcular el promedio (la media) obtenido por esos grupos.
Solución: Debe añadirse a la
tabla original una columna encabezada por fx en donde se anotarán los
resultados correspondientes a las multiplicaciones de cada valor nominal x por
su frecuencia f respectiva.
Por ejemplo, para la primera
fila de la tabla: fx = 2 × 0 = 0
La tabla completa con las
tres columnas queda como se muestra a la derecha.
La suma de los valores de la
columna fx es 544, de manera que utilizando la fórmula para el promedio,
recordando que n es la suma de todas las f, se obtiene:
Mediana
Nombre Cotidiano: Valor medio
Fórmula:
Para el cálculo de la
mediana en datos agrupados se utiliza la siguiente formula:
Identificación:
¿Qué
es?
Es la medida de tendencia
central que se define como aquel valor nominal que tiene, dentro de un conjunto
de datos ordenados, arriba y abajo de él, el mismo número de datos nominales.
En otras palabras, es el dato que está a la mitad, es el dato que divide en dos
partes iguales a un conjunto de datos.
La
mediana se puede calcular tanto para variables cardinales como ordinales, y es
la que más se utiliza para variables ordinales. Es menos operativa que la media
desde el punto de vista matemático. No es tan informativa como la media, ya que
en su cálculo interviene sólo el orden de los valores y no su magnitud. Sin embargo,
por este mismo motivo no está influenciada por la magnitud de los valores
extremos (es una medida robusta) y por eso, se puede utilizar cuando la media
no sea representativa
¿Para qué se utiliza?
Con
esta medida podemos identificar el valor que se encuentra en
el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto
de datos después que las observaciones se han ubicado en serie ordenada. Esta
medida nos indica que la mitad de los datos se encuentran por debajo de este
valor y la otra mitad por encima del mismo.
Ejemplo
Calcular la mediana de una distribución estadística que viene dada por
la siguiente tabla:
Moda
Nombre Cotidiano: Mayor Repetición
Fórmula
Símbolo: Mo
Para obtener la moda en datos agrupados se usa la siguiente fórmula:
Identificación:
¿Qué es?
Es la medida de tendencia central que se define como
aquel valor nominal que tiene la frecuencia mayor. Por lo tanto, una
distribución de frecuencias puede tener más de una moda o, inclusive, no tener
moda cuando todos los datos tienen frecuencia 1
¿Para qué se utiliza?
Nos
indica el valor que más veces se repite dentro de los datos; es decir, si
tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el
número 2 quien sería la moda de los datos. Es posible que en
algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores,
lo que se conoce como multimodal.
Ejemplo:
Medidas de
Variabilidad
Son
valores numéricos que indican o describen la forma en que las observaciones
están dispersas o diseminadas, con respecto al valor central. Son importantes
debido a que dos muestras de observaciones con el mismo valor central pueden
tener una variabilidad muy distinta.
Rango
Nombre cotidiano: Amplitud o recorrido
Se define como la diferencia existente entre
el valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no
es una medida muy significativa en la mayoría de los casos, pero indudablemente
es muy fácil de calcular. El rango se suele definir como la diferencia entre
los dos valores extremos que toma la variable. Es la medida de dispersión más
sencilla y también, por tanto, la que proporciona menos información. Además,
esta información puede ser errónea, pues el hecho de que no influyan más de dos
valores del total de la serie puede provocar una deformación de la realidad. Está
determinado por los dos valores extremos de los datos muéstrales, es
simplemente la diferencia entre la mayor y menor observación. Es una medida de
dispersión absoluta, ya que depende solamente de los datos y permite conocer la
máxima dispersión.
Requisitos
del rango
·
Ordenamos los números según su tamaño.
·
Restamos el valor mínimo del valor máximo
Ejemplo
Para una muestra (8, 7,
6, 9, 4 ,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se
encuentran en un rango de:
El rango se obtiene
dividiendo el número mayor con el menor de los datos estadísticos
Medio rango o rango
medio
El medio rango o rango medio de un conjunto de valores numéricos es
la media del mayor y menor valor, o la tercera parte del camino entre el dato
de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:
Ejemplo
Para una muestra de
valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor
valor Max= 8. El medio rango resolviéndolo
mediante la correspondiente fórmula sería:
Representación del medio
rango:
Varianza
Formula:
La varianza se representa por
Identificación:
¿Qué
es?
Es la media aritmética del cuadrado de las
desviaciones respecto a la media de una distribución estadística.
Propiedades de la varianza
1.-La varianza será siempre un valor
positivo o cero, en el caso de que las puntuaciones sean
iguales.
2.-Si a todos los valores de la variable se les suma un número la varianza no varía.
3.-Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
4.-Si tenemos varias distribuciones con
la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo
tamaño:
Si las
muestras tienen distinto tamaño:
Observaciones sobre la varianza
1.-La varianza, al igual que
la media, es un índice muy sensible a las puntuaciones extremas.
3.-La varianza no viene expresada en las mismas
unidades que los datos, ya que las desviaciones están elevadas al cuadrado.
Fuentes Bibliográficas:
http://www.ditutor.com/estadistica/medidas_centralizacion.html
http://www.profesorenlinea.cl/matematica/EstadisticaMediaMedianaModa.htm
http://www.fic.umich.mx/~lcastro/3tendenciacentral.pdf
http://www.eduteka.org/proyectos.php/1/3053
http://www.galeon.com/colposfesz/est501/distfrec/mtcent/mtcent.htm
http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
Fuentes Bibliográficas:
http://www.ditutor.com/estadistica/medidas_centralizacion.html
http://www.profesorenlinea.cl/matematica/EstadisticaMediaMedianaModa.htm
http://www.fic.umich.mx/~lcastro/3tendenciacentral.pdf
http://www.eduteka.org/proyectos.php/1/3053
http://www.galeon.com/colposfesz/est501/distfrec/mtcent/mtcent.htm
http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
No hay comentarios:
Publicar un comentario