ESTADÍSTICA DESCRIPTIVA. Temas de administracion.


ESTADÍSTICA DESCRIPTIVA.

La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos, con el objetivo de describir las características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.

Variables estadísticas.
Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los ingresos mensuales, las horas de sueño de un paciente en una semana, el precio medio del alquiler en las viviendas de un barrio de una ciudad, etc.

Clasificación:
Según el nivel de medida.

Variables cualitativas
Son el tipo de variables que como su nombre lo indica expresan distintas cualidades, características o modalidad.  Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y nohombre y mujer o ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
·         Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.
·         Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden, como por ejemplo los colores o el lugar de registro


Variables cuantitativas.
Son las variables que toman como argumento cantidades numéricas, son variables matemáticas. Las variables cuantitativas además pueden ser:
·         Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
·         Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que exista indefinidos valores entre dos variables.


Según la influencia:

Según la influencia que le asignemos a unas variables sobre otras, estas podrán ser:
ü  Variables independientes
Una variable independiente es aquella cuyo valor no depende de otra variable.
Las variables independientes son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.
La variable independiente se suele representar en el eje de abscisas.
ü  Variables dependientes
Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable.
La variable dependiente es una función que se suele representar por la y. La variable dependiente se representa en el eje ordenadas. Son las variables de respuesta que se observan en el estudio, y que podrían estar influidas por los valores de las variables independientes.

ü  Otras variables

ü  Variables intervinientes.
Son aquellas características o propiedades que, de una manera u otra, afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes. Y es muy similar a la variable moderadora aunque no son iguales solo son muy similares a la forma de relacionarlas.

ü  Variables moderadoras
Según Tuckman: Representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.

Por lo general, la información proporcionada por la estadística descriptiva puede ser trasmitida con facilidad y eficacia mediante una variedad de herramientas gráficas, como pueden ser:

ü  Gráficos de tendencia: es un trazo de una característica de interés sobre un periodo, para observar su comportamiento en el tiempo.

ü  Gráfico de dispersión: ayuda al análisis de la relación entre dos variables, representado gráficamente sobre el eje x y el correspondiente valor de la otra sobre el eje y.

ü  Histograma: describe la distribución de los valores de una característica de interés.



MEDIDAS DE TENDENCIA CENTRAL.
Se llama medidas de posición, tendencia central o centralización a unos valores numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de una variable estadística. Estas medidas se conocen también como promedios.

Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado entre el menor y el mayor de la serie y que su cálculo y utilización resulten sencillos en términos matemáticos.

Se distinguen dos clases principales de valores promedio:

Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática, ponderada), mediana y moda.
Las medidas de posición no centrales: entre las que destacan especialmente los cuantiles.



Media aritmética:
Se define media aritmética de una serie de valores como el resultado producido al sumar todos ellos y dividir la suma por el número total de valores. La media aritmética se expresada como .

Dada una variable x que toma los valores x1, x2, ..., xn, con frecuencias absolutas simbolizadas por f1, f2, ..., fn, la media aritmética de todos estos valores vendrá dada por:

Mediana:
La media aritmética no siempre es representativa de una serie estadística. Para complementarla, se utiliza un valor numérico conocido como mediana o valor central.

Dado un conjunto de valores ordenados, su mediana se define como un valor numérico tal que se encuentra en el centro de la serie, con igual número de valores superiores a él que inferiores. Normalmente, la mediana se expresa como Me.

Moda
En una serie de valores a los que se asocia una frecuencia, se define moda como el valor de la variable que posee una frecuencia mayor que los restantes. La moda se simboliza normalmente por Mo.

Un grupo de valores puede tener varias modas. Una serie de valores con sólo una moda se denomina unimodal; si tiene dos modas, es bimodal, y así sucesivamente.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

Moda de datos agrupados.
Para obtener la moda en datos agrupados se usa la siguiente fórmula:

Donde:


Medidas de dispersión.

Las medidas de dispersión muestran la variabilidad de una distribución, indicándolo por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media.



La dispersión es importante porque:
·         Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.
·         Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
·         Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Medidas.
Las medidas de dispersión son números reales no negativos, su valor es igual a cero cuando los datos son iguales y este se incrementa a medida que los datos se vuelven más diversos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. 
Pero la suma de desviaciones positivas y negativas podrían cancelarse entre sí, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (por ejemplo desviación media) y otra es tomando las desviaciones al cuadrado (por ejemplo varianza).

Medidas dimensionales.
La mayoría de las medidas de dispersión se encuentran en las mismas unidades de la cantidad que está siendo medida. Entre ellas se encuentran principalmente:
·         Desviación típica por un lado o por el otro: La desviación típica informa sobre la dispersión de los datos respecto al valor de la media.
·         Rango: En estadística, es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios. Se le suele simbolizar con R.
·         Medio rango: el rango medio o extremo medio de un conjunto de valores de datos estadísticos es la media aritmética de los valores máximos y mínimos de un conjunto de datos.
·         Rango intercuartílico: es una medida de dispersión estadística, igual a la diferencia entre los percentiles 75 y 25.
·         Covarianza: es un estadístico que indica la relación de las puntuaciones entre sí
·         Desviación media absoluta (MAD): es una medida sólida de la variabilidad de una muestra univariable de datos cuantitativos.
·         Diferencia media absoluta (univariante) es una medida de dispersión estadística igual a la diferencia media absoluta de dos valores independientes extraídos de una distribución de probabilidad.
·         Desviación media

Medidas adimensionales.
Otras medidas de dispersión son adimensionales. Ejemplos de ellas son:
·         Coeficiente de correlación de Pearson: permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio.
·         Diferencia absoluta media relativa
·         Entropía: Mientras que la entropía de una variable discreta es de ubicación-invariante y escala-independiente, y por lo tanto no es una medida de dispersión en el sentido anterior, la entropía de una variable continua es invariante de ubicación y aditivo en escala.
·         Coeficiente de variación



FUENTES BIBLIOGRAFIAS:




Comentarios