miércoles, 20 de noviembre de 2013

Importancia y uso en la Administración de Sistemas Computacionales

¿Qué es Estadística?

La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.

La estadística es de gran importancia en el área administrativa ya que es una ciencia que facilita la toma de decisiones:

  • Mediante la presentación ordenada de los datos observados en tablas y gráficos estadísticos
  • Reduciendo los datos observados a un pequeño número de medidas estadísticas que permitirán la comparación entre diferente series de datos
  • Y estimando la probabilidad de éxito que tiene cada una de las decisiones posibles

CLASES DE ESTADÍSTICA


La estadística normalmente se divide en dos grandes categorías: La estadística DESCRIPTIVA y la estadística INFERENCIAL.


Importancia y uso en la Administración de Sistemas Computacionales

La estadística es una de las ramas de la ciencia matemática que se centra en el trabajo con datos e informaciones que son ya de por sí numéricos o que ella misma se encarga de transformar en números. La estadística, si bien es una ciencia de extracción exacta, tiene una injerencia directa en cuestiones sociales por lo cual su utilidad práctica es mucho más comprensible que lo que sucede normalmente con otras ciencias exactas como la matemática.

La función principal de la estadística es justamente la recolección y agrupamiento de datos de diverso tipo para construir con ellos informes estadísticos que nos den idea sobre diferentes y muy variados temas, siempre desde un punto de vista cuantitativo y no cualitativo. Esto es muy importante remarcarlo ya que la estadística se convierte entonces en una ciencia que nos habla de cantidades (por ejemplo, cuántas personas viven en un país por metro cuadrado) pero no nos da información directa sobre la calidad de vida de esas personas.

La estadística tiene mucha importancia ya que por medio de ella el hombre puede manejar mucha información en forma sintetizada mediante la clasificación, el análisis para poder entenderla, de ese modo podrá controlarla, posteriormente la convierte en cifras, cálculos y datos que le ayudan obtener una estadística real y confiable para la toma de decisiones, desde luego pueden ser en cosas tan simples como el manejo de los gastos de casa, en el trabajo, en la escuela como estadísticas de población, etc. En muchas cosas. Pero para que el hombre pueda hacer todo esto, debe tener un método, una forma de recolectar e interpretar esos datos; este método es a lo que llamamos estadística.


El hombre es el usuario principal de la estadística, sin embargo también los sistemas computacionales que utiliza el hombre, ya que es una herramienta básica en el trabajo, como las empresas en diferentes áreas, ya que es usada para entender la variabilidad de sistemas de medición, control de procesos, para compilar datos y para tomar decisiones. En estas aplicaciones es una herramienta clave, y probablemente la única herramienta disponible.

martes, 19 de noviembre de 2013

PLANTEAMIENTO DE HIPÓTESIS


Las hipótesis indican lo que se está buscando, investigando, o tratando de comprobar (probar a través de la investigación).  
Son explicaciones tentativas del fenómeno investigado, formuladas  a manera de proposición.
La hipótesis es el centro, la médula, el eje del método deductivo  cuantitativo. Es decir, es la idea que promueve y determina la  investigación. Nos ayudan a saber que buscamos y proporcionan orden y  lógica al estudio.

No todas las investigaciones requieren de hipótesis, depende sobre todo del enfoque del estudio, y del alcance inicial del mismo.
Algunos tipos de estudios permiten formular la hipótesis durante o después de  recolectar los datos, es decir, durante el proceso de investigación.

Los estudios descriptivos que intentan pronosticar un hecho o cuantificarlo – cifrarlo,  requieren de hipótesis.

Los estudios cuantitativos que pretender relacionar dos variables, correlacionales, y  los que pretenden establecer las causas de los fenómenos analizados, SIEMPRE llevan  hipótesis.

Los estudios mixtos, cuantitativos y cualitativos, pueden tener o no tener hipótesis,  depende del planteamiento que realicen las personas que diseñan la investigación.

Las hipótesis surgen del planteamiento del problema, y pueden ser respuestas  tentativas a las preguntas directrices de la investigación.
Lo más común es que las hipótesis surjan de los objetivos y preguntas del estudio,  reevaluadas – revisadas a partir de la revisión de la literatura existente sobre el tema.

Procedimiento: 


Características de las hipótesis.

1. Las hipótesis deben referirse a una situación social real, es decir, han de estar contextualizadas.
2. Los términos de las hipótesis deben ser comprensibles, precisos y lo más concretos  posibles.
3. La relación entre las variables que se establezcan en la hipótesis debe ser clara, concreta y verosímil (creíble y posible).
4. Los términos y las relaciones que se formulen en las hipótesis deber ser observables y  medibles.
5. Las hipótesis deben estar relacionadas con técnicas disponibles para probarlas, es decir,  se han de formular hipótesis que requieran técnicas al alcance del equipo investigador.

 Tipos de hipótesis.

 Un estudio puede tener más de una hipótesis, y no necesariamente todas las hipótesis  son verdaderas.

 Existen diferentes clasificaciones de los tipos de hipótesis, en este curso se ha optado  por la siguiente clasificación.

a.) Hipótesis de Investigación.
b.) Hipótesis nulas.
c.) Hipótesis alternativas.
d.) Hipótesis estadísticas

Hipótesis de Investigación.

 Las hipótesis de investigación también se denominan hipótesis de trabajo, y se  representan mediante el símbolo Hi, en el caso que se formule más de una se numeran, por  ejemplo: Hi1, Hi2,…

a) Hipótesis descriptivas del valor de las variables.
 Son las hipótesis que establecen como se va a manifestar, comportar, una variable ante un fenómeno o situación.

b) Hipótesis correlaciónales: 

Ø  Especifican las relaciones entre dos o más variables.
Ø  Pueden ser predictivas (predecir la relación) o parcialmente explicativas (explicar parcialmente un fenómeno).
Ø  Cuando se relacionan varias variables se tienen diversas hipótesis.

c) Hipótesis de la diferencia entre grupos.
 Se utilizan en estudios que pretenden comparar el comportamiento entre grupos de personas o fenómenos – situaciones.

d) Hipótesis que establecen relaciones de casualidad.
Ø  Afirma las relaciones entre dos o más variables, y cómo se dan estas relaciones.
Ø  Proponen un sentido de entendimiento de las relaciones.
Ø  Establecen relaciones de causa – efecto.
Ø  Para establecer una relación de causalidad se han de cumplir los siguientes puntos:

§   debe haberse demostrado correlación antes, es decir, primero se ha de demostrar que existe relación entre ellas,
§   la causa debe ocurrir antes que el efecto,
§   los cambios en la causa deben provocar cambios en el efecto,
§   la causa es la variable independiente, y el efecto es la variable dependiente,
§   se ha de considerar que existen variables intervinientes, que no son la causa ni el efecto, que pueden modificar la relación.


Tipos de hipótesis de casualidad:

v  bivariadas, una causa y un efecto (1 a 1),
v  multivariadas, varias causas y un efecto (varias a 1), o una causa y varios efectos  (1 a varias).
v
Hipótesis nulas.

Las hipótesis nulas son las opuestas a las de investigación, y se representan mediante el símbolo H0. Estas hipótesis niegan o refutan la relación que establece la hipótesis de investigación. En el caso que exista más de una hipótesis de investigación existirá más de una hipótesis nula.


Hipótesis alternativas.

 Las hipótesis alternativas presentan posibilidad, situaciones diferentes a las  establecidas en las hipótesis de investigación y nulas, se representan mediante el símbolo Ha. Solamente se pueden formular cuando realmente existen otras posibilidades a las planteadas en Hi y H0.

Hipótesis estadísticas.

 Estas hipótesis son exclusivas de estudios cuantitativos, y representan la transformación de los otros tipos de hipótesis a estimaciones estadísticas. Se representan mediante el símbolo He.  Expresado de otra forma, las hipótesis estadísticas consisten en cuantificar las otras hipótesis, es decir expresarlas numéricamente.

¿Cuántas hipótesis se deben formular en una investigación?

 Depende del estudio se pueden utilizar más o menos hipótesis. Se han de utilizar las necesarias para guiar el estudio.  Se pueden utilizar varias hipótesis y de diferentes tipos, pero no existe ninguna regla respecto a la cantidad y los tipos.
Recomendación: Incluir las hipótesis que se consideren más convenientes para que los usuarios – lectores de la investigación comprendan mejor el propósito.

Hipótesis y Resultados de la Investigación.

 Una hipótesis no se puede probar con un solo estudio, es decir, no es suficiente que los resultados de un estudio corroboren – confirmen la hipótesis para decir que es cierta.
Esto se debe a que pueden darse circunstancias que no se han considerado (variables intervinientes) que condicionan los resultados.
Al analizar los resultados se pueden presentar las siguientes situaciones:

v  los resultados están acordes a la hipótesis, por tanto el estudio apoya la hipótesis de investigación.
v  los resultados están en contra de la hipótesis, por tanto el estudio apoya la hipótesis nula.
v  los resultados ni están acordes ni en contra de la hipótesis, por tanto el estudio apoya hipótesis alternativas.

Ante estas posibilidades puede ser interesante y práctico plantear, considerar, tanto hipótesis de investigación, como nulas y alternativas.









BIBLIOGRAFIA

miércoles, 13 de noviembre de 2013

Medidas de tendencia Central y Variación


A veces, de los datos recolectados ya organizados en alguna de las formas vistas en capítulos anteriores, se desea encontrar una especie de punto central en función de sus frecuencias. En Estadística se conocen tres diferentes, llamadas medidas de tendencia central, cuya utilización varía de acuerdo con lo que se desee del conjunto de datos recolectados.

Esas tres medidas de tendencia central son la media, la mediana y la moda. Cada una de ellas se estudiará en dos partes: primero, cuando los datos están organizados en tablas de distribución de frecuencias simple y, segundo, cuando están organizados en intervalos. Además, a veces difieren las fórmulas para calcular alguna de ellas si se trata de poblaciones o de muestras. En caso de que no se diga nada, deberá entenderse que la fórmula es la misma para ambas.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.1 En este caso se incluyen también los cuantíales entre estas medidas.

Entre las medidas de tendencia central tenemos:

* Media.

* Media ponderada.

* Media geométrica.

* Media armónica.

* Mediana.

* Moda.


Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está observando, en este caso se observan variables cuantitativas.

Las tres principales medidas de tendencia central son:

• La media aritmética
• La moda
• La mediana

Media

Nombre Cotidiano: Promedio

Fórmula:
¿Qué es?
Es el valor característico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muestrales.

¿Para qué se utiliza?
 Es un método para obtener la tendencia central de un espacio muestral. El término “media aritmética” es preferido en las matemáticas y la estadística porque ayuda a distinguirlo de otros medios como la geométrica y media armónica.

Además de las matemáticas y la estadística, la media aritmética se utiliza con frecuencia en campos como la economía, la sociología y la historia, a pesar de que se utiliza en casi todos los campos académico, hasta cierto punto. Por ejemplo, el PIB per cápita da una aproximación de la renta media aritmética de la población de un país.
Mientras que la media aritmética es a menudo utilizado para comunicar las tendencias centrales, no es una estadística robusta, lo que significa que está fuertemente influenciado por los valores extremos. En particular, para las distribuciones sesgadas, la media aritmética no puede acuerdo con la propia noción de centro “, y robusto estadísticas”, como la mediana puede ser una mejor descripción de la tendencia central.

Ejemplo: Las calificaciones de Matemáticas de los grupos “A” y “B” se muestran en la tabla. Calcular el promedio (la media) obtenido por esos grupos.


Solución: Debe añadirse a la tabla original una columna encabezada por fx en donde se anotarán los resultados correspondientes a las multiplicaciones de cada valor nominal x por su frecuencia f respectiva.
Por ejemplo, para la primera fila de la tabla: fx = 2 × 0 = 0
La tabla completa con las tres columnas queda como se muestra a la derecha.
La suma de los valores de la columna fx es 544, de manera que utilizando la fórmula para el promedio, recordando que n es la suma de todas las f, se obtiene:


Mediana
Nombre Cotidiano: Valor medio
Fórmula:



Para el cálculo de la mediana en datos agrupados se utiliza la siguiente formula:



Identificación:



¿Qué es?

Es la medida de tendencia central que se define como aquel valor nominal que tiene, dentro de un conjunto de datos ordenados, arriba y abajo de él, el mismo número de datos nominales. En otras palabras, es el dato que está a la mitad, es el dato que divide en dos partes iguales a un conjunto de datos.
La mediana se puede calcular tanto para variables cardinales como ordinales, y es la que más se utiliza para variables ordinales. Es menos operativa que la media desde el punto de vista matemático. No es tan informativa como la media, ya que en su cálculo interviene sólo el orden de los valores y no su magnitud. Sin embargo, por este mismo motivo no está influenciada por la magnitud de los valores extremos (es una medida robusta) y por eso, se puede utilizar cuando la media no sea representativa

¿Para qué se utiliza?
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:



Moda

Nombre Cotidiano: Mayor Repetición
Fórmula
Símbolo: Mo
Para obtener la moda en datos agrupados se usa la siguiente fórmula:


Identificación:


¿Qué es?
Es la medida de tendencia central que se define como aquel valor nominal que tiene la frecuencia mayor. Por lo tanto, una distribución de frecuencias puede tener más de una moda o, inclusive, no tener moda cuando todos los datos tienen frecuencia 1
¿Para qué se utiliza?
Nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien sería la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal.

Ejemplo:




Medidas de Variabilidad
Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central. Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.

Rango

Nombre cotidiano: Amplitud o recorrido

 Se define como la diferencia existente entre el valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular. El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la que proporciona menos información. Además, esta información puede ser errónea, pues el hecho de que no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad. Está determinado por los dos valores extremos de los datos muéstrales, es simplemente la diferencia entre la mayor y menor observación. Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.

Requisitos del rango
·         Ordenamos los números según su tamaño.
·         Restamos el valor mínimo del valor máximo


Ejemplo
Para una muestra (8, 7, 6, 9, 4 ,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de:

El rango se obtiene dividiendo el número mayor con el menor de los datos estadísticos

Medio rango o rango medio
El medio rango o rango medio de un conjunto de valores numéricos es la media del mayor y menor valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

Ejemplo

Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la correspondiente fórmula sería:

Representación del medio rango:

Varianza

Formula:
La varianza se representa por 




Identificación:


¿Qué es?
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

Propiedades de la varianza

1.-La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2.-Si a todos los valores de la variable se les suma un número la varianza no varía.
3.-Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
4.-Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:


Observaciones sobre la varianza

1.-La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2.-En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.