1. RESUMEN NUMÉRICO DE UNA SERIE ESTADÍSTICA
1.A MEDIDAS DE TENDENCIA CENTRAL
- MEDIA ARITMÉTICA
- MEDIANA
- MODA
1.B MEDIDAS DE POSICIÓN
- PERCENTILES
- DECILES
- QUANTILES
1.C MEDIDAS DE DISPERSIÓN O VARIABILIDAD
- RANGO O RECORRIDO
- DESVACIÓN MEDIA
- DESVIACIÓN TÍPICA O ESTÁNDAR
- VARIANZA
2. DISTRIBUCION NORMAL
ASIMETRIA
2.1 DISTRIBUCIÓN SIMETRICA
2.2 DISTRIBUCIÓN ASIMETRICA POSITIVA
2.3 DISTRIBUCIÓN ASIMETRICA NEGATIVA
CURTOSIS
3.1 MESOCÚRTCA
3.2 LEPTOCÚRTICA
3.3 PLATICÚRTICA
Se aplican únicamente a variables cuantitativas.
1. RESUMEN
NUMÉRICO DE UNA SERIE ESTADÍSTICA.
Además de las tablas y gráficos podemos resumir una serie de observaciones
mediante “estadísticos”: “Función de los datos observados”. Solo se aplican a
variables cuantitativas continuas (edad, peso, talla, tiempo, etc). Hay tres grandes tipos de medidas
estadísticas:
1.A Medidas de tendencia central: dan idea del comportamiento central de los
sujetos.
1.B Medidas de posición: dan idea de la magnitud, tamaño o posición de las
observaciones de los datos una vez que están ordenados de menor a mayor.
1.C Medidas de dispersión o variabilidad: dan información
acerca de la heterogeneidad de los sujetos, es decir, si son muy diferentes
entre sí o no.
A. MEDIDAS DE
TENDENCIA CENTRAL
- Media aritmética o media (x): para variables cuantitativas
Se calcula para os variables cuantitativas y se trata del centro
geométrico o de gravedad de nuestros datos. Es la suma de todos los valores de
la variable observada entre el total de observaciones. La fórmula es: x= Ʃx/n
Cuando los datos están agrupados (dos intervalos), para calcular la
media utilizamos como valor de referencia de cada intervalo su marca de clase:
se calcula una media aritmética ponderada que se calcula sumando la marca de
clase por la frecuencia absoluta, entre N.
x= Ʃmc * fi /n (multiplicamos la marca de clase por la
frecuencia absoluta y vamos sumando, luego dividimos entre el número de
sujetos)
- Mediana: medida de posición y central
Es el valor de la observación
tal que deja a un 50% de los datos menor
y otro 50% de los datos mayor.
Si el número de observaciones es impar
el valor de la observación será justamente la observación que ocupa la posición
(n+1/2) Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que
tiene el sujeto 38.
Si el número de observaciones es par,
el valor de la mediana corresponde a la media entre los dos valores centrales,
es decir, la media entre la observación n/2 y la observación (n/2)+1. Ejemplo:
cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y
hacemos la media aritmética entre ambos.
- Moda: Es
el valor con mayor frecuencia (que más veces se repite). Si hay más de una se
dice que la muestra es bimodal (dos modas) o multimodal (más de dos modas). Se
puede calcular para cualquier tipo de variable tanto la cualitativa como la
cuantitativa. La moda no es el número más frecuente si no la categoría.
B.
MEDIDAS DE POSICIÓN O CUANTILES
Se calculan para variables cuantitativas
y, al igual que la mediana, sólo tienen en cuenta la posición ordenado de mayor
o menor de los valores en la muestra.
Los cuantiles más usuales son
los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada
en 100 (perciles), 10 (deciles) ó 4 partes (cuartiles), respectivamente.
- Percentiles:
I. Dividen la muestra ordenada en 100
partes.
II. El valor del P50
corresponde al valor de la mediana.
- Deciles: 10,20,30,40,50,60,70,80,90,100
I. Dividen la muestra ordenada en 10
partes.
II. El valor del D5
corresponde al valor de la mediana y, por tanto, al del P50.
- Cuartil:
I. Dividen la muestra ordenada en 4
partes.
II. El Q1, primer cuartil
indica el valor que ocupa una posición en la serie numérica de forma que el 25%
de las observaciones son menores y que el 75% son mayores.
III. El Q2, segundo cuartil
indica el valor que ocupa una posición en la serie numérica de forma que el 50%
de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2
coincide con el valor del D5, con el valor de la mediana P50.
IV. El Q3, tercer cuartil
indica el valor que ocupa una posición en la serie numérica de forma que el 75%
de las observaciones son menores y que el 25% son mayores.
V. El Q4, cuarto cuartil
indica el valor mayor que se alcanza en la serie numérica.
C. MEDIDAS
DE DISPERSIÓN
La información
aportada por las medidas de tendencia central es limitada.
- Rango o recorrido (R)Diferencia
entre el mayor y el menor valor de la muestra lXn-X1l
(valor absoluto).
Según el ejemplo
anterior:
R1=22-18=4
R2=30-9=21 (esto ya nos indica
que la serie 2 tiene más dispersión).
- Desviación
media (dm): Sumatorio de cada observación con respecto de la media. Media aritmética de las distancias de cada
observación con respecto a la media de la muestra:
- Desviación
típica o estándar (S) : Cuantifica el
error que cometemos si representamos una muestra únicamente por su media. Esta es la que más se emplea debido a que esta
nos da un mayor rango de error.
Por término medio, en
la serie 1, las observaciones se diferencian de la media en 1,2 años.
Si
te quedas solo con la media de edad: en el 1º, sólo te equivocas 1,58 años,
pero en el 2º te equivocas 8,74.
Coeficiente de variación (CV):
Es una medida de dispersión relativa (adimensional) ya que todas las d
emás se
expresan en la unidad de medida de la variable. Nos sirve para comparar la
heterogeneidad de dos series numéricas con independencia de las unidades de
medidas. Se expresa sin unidades. El C.V. siempre va de 0 a 1.
2. DISTRIBUCIONES
NORMALES
En estadística se llama distribución normal, distribución de Gauss o
distribución gaussiana, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece en fenómenos reales.
La distribución normal en un histograma aparece una especie de Campana,
por eso la campana de Gauss. Y es simétrica respecto de los valores de posición
central, es decir que la moda va a coincidir con la media y la mediana.
La gráfica de su función de densidad tiene una forma acampanada y es
simétrica respecto de los valores posición central (media, mediana y moda, que
coinciden en estas distribuciones). Es simetrica dejando la mitad
de los valores por debajo del punto maximo y la mitad de los valores por
encima. Esta curva se conoce como campana de Gauss.
Una distribución normal sigue estos principios básicos: si al valor de
la media le restamos y le sumamos una desviación típica, si la serie numérica
siguiera una distribución normal (como el colesterol). Dice que el 68.25% de
las observaciones se va a sumar entre los valores de la suma y la resta de la
media a una desviación típica. Estos datos varían si sumamos una, dos o tres
desviaciones típicas.
ASIMETRÍAS
La asimetría es al
lado contrario al que vemos el pico (la moda), es decir si vemos el pico hacia
la derecha la asimetría es a la izquierda, y si la moda está a la izquierda la
asimetría esta hacia la derecha.
Coeficiente de asimetría de una
variable: Grado de asimetría de
la distribución de sus datos en torno a su media, cuanto más asimétrica sea,
valores más diferentes encontraremos. Es adimensional y se define:
g1 =0 (distribución simétrica; existe
la misma concentración de valores a la derecha y a la izquierda de la media).
g1 >0 (distribución asimétrica
positiva; existe mayor concentración de valores a la derecha de la media que a
su izquierda).
g1 <0 (distribución asimétrica
negativa; existe mayor concentración de valores a la izquierda de la media que
a su derecha).
Ej: 0’9 es muy asimétrica a la izquierda
CURTOSIS o apuntamiento de la
curva.
No tiene relación con
la simetría.
Coeficiente de apuntamiento o curtosis de una variable, sirve para
medir el grado de concentración de los valores que toma en torno a su media.
Los datos se acumulan mucho, mientras más se acumulen, más apuntada esta la
curva.
Se elige como
referencia una variable con distribución normal, de modo que para ella el
coeficiente de curtosis es 0.
Los resultados pueden
ser los siguientes:
g2=0 (distribución mesocúrtica o
normal). Presenta un grado de concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribución normal).
g2>0 (distribución leptocúrtica).
Presenta un elevado grado de concentración alrededor de los valores centrales
de la variable.
g2<0 (distribución platicúrtica).
Presenta un reducido grado de concentración alrededor de los valores centrales
de la variable.

No hay comentarios:
Publicar un comentario