ÍNDICE:
1. Inferencia estadística
2. Proceso de la inferencia estadístca
3. Error estándar. Cálculo del error estándar.
4. Teorema central del limite
5. Intervalos de confianza (I.C)
6. Procedimiento muestral
7. Tipos de muestreo probabilístico y no probabilístico.
7.1 Probabilístico
8. Tipos
9. Tamaño de la muestra
Poco a poco, nos hacercamos al final de esta asignatura y con ella, a la finalización de mi primer año como universitaria. Y durante este curso, pues en algunos momentos me he sentido como el "3D man" de la imagen, perdida entre el temario, los amigos, trabajos las futuras elecciones y salidas, mi vida...
1.
INFERENCIA ESTADÍSTICA
Cuando planteamos un
estudio en el ámbito sanitario para establecer relaciones entre variables,
nuestro interés no suele estar exclusivamente en los pacientes concretos a los
que hemos tenido acceso, sino más bien en todos los pacientes similares a
estos. (Inferir)
Al inferir nunca tienes el dato seguro de toda la población sobre la que deduces los resultados de un estudio realizado anteriormente sobre la población que nos interesa, al inferir siempre hay error aleatorio.
Ø Al conjunto de pacientes sobre los que queremos estudiar alguna cuestión
(sacar conclusiones) le llamamos población de estudio.
Ø Al conjunto de individuos concretos que participan en el estudio le
denominamos muestra. Ej: donde estudio el nivel de colesterol.
Ø Al número de individuos de la muestra le denominamos tamaño muestral. Ej:
N=40
Ø Al conjunto de procedimientos estadísticos que permiten pasar de lo
particular, la muestra, a lo general, la población, le denominamos inferencia
estadística.
Ø Al conjunto de procedimientos que permiten elegir muestras de tal forma
que éstas reflejen las características de la población le llamamos Técnicas de muestreo,
esto se hace para evitar sesgos.
Siempre que trabajamos con muestras, aunque sean representativas, (no estudiamos el problema en toda la población sino en una parte de ella), hay que asumir un cierto error.
Ø Si la muestra se elige por un procedimiento de azar, se puede evaluar ese
error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o
aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio. Solo calculable si se utiliza el
azar.
Ø En los muestreos no probabilísticos (Ej: estudios de conveniencia, Utilizar
a los pacientes de mi hospital como muestra), no es posible evaluar el error.
En los muestreos probabilísticos, el error aleatorio es inevitable, pero es
evaluable gracias a las leyes de la probabilidad.
Ø Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del
error aleatorio por probabilidad.
2.
PROCESO DE LA INFERENCIA ESTADÍSTICA
Tenemos una población
de estudio, y la medida que queremos obtener se llama parámetro. Hacemos una selección aleatoria y obtenemos
una muestra, y la medida de la variable de estudio obtenida en la muestra, se
denomina estimador.
3.
ERROR ESTÁNDAR.
Ø Es la medida que trata de captar la variabilidad de los valores del
estimador (en este caso la media de los días de curación de la úlcera).
Ø El error estándar de cualquier estimador mide el grado de variabilidad en
los valores del estimador en las distintas muestras de un determinado tamaño
que pudiésemos tomar de una población.
Ø Cuanto más pequeño es el error estándar de un estimador, más nos podemos
fiar del valor de una muestra concreta.
Si en lugar de variar el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46, que es el valor de la media en la población.
En la inferencia estadística el error estándar= desviación típica
v
CÁLCULO DEL ERROR ESTÁNDAR
Depende de cada
estimador:
De ambas fórmulas se deduce que, mientras mayor sea el tamaño de una muestra, menor será el error estándar. Y viceversa.
4.
TEOREMA CENTRAL DEL LÍMITE
Para estimadores que
pueden ser expresados como suma de valores muestrales, la distribución de sus
valores sigue una distribución normal con media de la población y desviación
típica igual al error estándar del estimador de que se trate.
Si en vez de una muestra, seleccionara 100 muestras y calculara las medias y las pusiera en un histograma, tendría una distribución normal, en la cual el error estándar coincide con la desviación estándar del histograma, por lo tanto si le sumo y le resto a la media una vez la desviación estándar, es decir, el error estándar, tendré el 68.26% de las observaciones.
5.
INTERVALOS DE CONFIANZA:
Ø Son un medio de conocer el parámetro en una población midiendo el error
que tiene que ver con el azar (error aleatorio/estándar).
Ø Se trata de un par de números tales que, con un nivel de confianza
determinados, podamos asegurar que el valor del parámetro es mayor o menor que
ambos números. X=168 en la muestra
I.C= 150-198
Ø Se calcula considerando que el estimador muestral sigue una distribución
normal, como establece la teoría central del límite.
Cálculo del I.C:
- Z es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S en el teorema central del límite. Si I.C es más alto, más probabilidad de que el intervalo esté dentro y por tanto la horquilla será mayor.
- Para nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del 68% porque asumimos un error máximo del 5%)
- - Para nivel de confianza 95% z=1,96
- - Para nivel de confianza 99% z=2,58
- El signo significa que cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior.
Mientras mayor sea la confianza (z) que queramos otorgar al intervalo, éste será más amplio, es decir, el extremo inferior y el superior del intervalo estarán más distanciados y, por tanto, el intervalo será menos preciso.
Se puede calcular intervalos de confianza para cualquier parámetro: medias aritméticas, proporciones (de fumadores de la población), riesgos relativos, odds ratio…
en las formulas cada vez que usamos proporción la expresamos en la formula en tantos por 1 y no en tantos por 100 (%)
Por tanto, la curva normal es un modelo matemático basado en Teorema del Limite Central y Ley de los Grandes Números
Permite comparar valores mediante el uso de unas tablas ya establecidas y para ello hay que
Permite comparar valores mediante el uso de unas tablas ya establecidas y para ello hay que
- Tipificar los valores (“normalizarlos”)
- Compararlos con los resultados de las tablas ya establecidas
La tipificación nos permite conocer si otro valor corresponde o no a esa distribución de frecuencia.
Zx= X – (Media)/ S ( desviación)
6. PROCEDIMIENTO MUESTRAL. (Técnica De Muestreo).
- Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.
- La población general de la queremos obtener conclusiones la vamos a elegir al azar (aleatoriamente), para obtener la muestra representativa y a partir de esta hacer inferencia de la población entera à (confianza (intervalo de confianza) en %).
7. TIPOS DE MUESTREO.
7.1 Probabilístico. Todos los sujetos de la población tienen una probabilidad distinta de 0 en la selección de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo, si lo hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a encontrarnos para incluir en la selección. Existe una probabilidad conocida de que un sujeto sea escogido y es la misma para todos.
1. Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el que pase por aquí)
Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:
- De sorteo o rifa: Asignamos un nº a cada miembro de la población, calculamos el tamaño muestral y seleccionamos aleatoriamente ese nº. Desventaja de este método es que no puede usarse cuando el universo es grande (500/2000). Ej: bombo con bolitas/papelitos
- Tabla de números aleatorios: más económico y requiere menor tiempo. Se hace cuando disponemos de una lista informatizada en una base de datos de la población de estudio.
2. Aleatorio sistemático. estas tres son variaciones del muestreo aleatorio simple.
Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.
3. Estratificado: Se caracteriza por la subdivisión de la población en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados. Ej: Si quiero hacer un estudio sobre cifras de presión arterial, si la población de estudio el 25% son menores de 15 años, el 50% entre 15-65 años y el 25% mayor de 65. Si la muestra que necesito es de 200 personas. Seleccionare aleatoriamente siguiendo el procedimiento anterior 100 personas de entre 15-65 años, 50 menores de 15 años, y 50 mayores de 65. Se usa principalmente por motivos de edad y sexo.
4. Conglomerados: Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados. Por ejemplo, quiero hacer un estudio de Andalucía (poblaciones amplias sobre las que se usa este método), calculo el tamaño muestral, pero si hago un muestreo aleatorio me puede salir cada sujeto en un pueblo distinto de la población andaluza, para evitarlo se seleccionan un grupo de municipios y dentro de ese municipio se hacen muestreo aleatorio simple.
En este tipo de muestreo el investigador no conoce la distribución de la variable.
Las inferencias que se hacen en una muestra conglomerada no son tan confiables como las que se obtienen en un estudio hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez.
En este tipo de muestreo el investigador no conoce la distribución de la variable.
Las inferencias que se hacen en una muestra conglomerada no son tan confiables como las que se obtienen en un estudio hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez.
7.2 No probabilístico o de conveniencia del investigador
- No se sigue el proceso aleatorio.
- No puede considerarse que la muestra sea representativa de una población.
- Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.
8. Tipos:
- Por cuotas: en el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc. (No hay aleatoriedad). Ej: Me pongo a pasar un cuestionario en una esquina, pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51 que pasa por la esquina.
- Accidental: consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente.
- Por conveniencia o intencional. En el que el investigado, decide según sus objetivos, los elementos que integraran la muestra, considerando las unidades “típicas” de la población que se desea conocer. (En función de nuestro interés, nuestra accesibilidad…).
9. TAMAÑO DE LA MUESTRA.
El tamaño de la muestra a tomar va a depender de
- Error estándar.
- De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. Más grande debe ser la muestra para que más pequeño sea el error.
- De la variabilidad de la variable a estudiar (varianza en la población).
- El tamaño de la población de estudio.
Calculo del tamaño de una muestra para estimar la media de una población.
n= Z2*S2/e2
Z es un valor que depende del nivel de confianza 1 – α con que se quiera dar a los intervalos calculados a partir de estimadores de esa muestra. (Para nivel de confianza 95%, z= 1.96; y para nivel de confianza 99% z= 2.58).
S2es la varianza poblacional.
e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.
n´=n/1+(n/N)
- P es la proporción de una categoría de la variable. Fumadores y
- 1-p: es la proporción de la otra categoría. No fumadores
- Z: es el valor que depende del nivel de confianza 1 - α
- N: es el tamaño de la población.
- e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.
Si no se dice nada de estudios pilotos previos, se distribuyen ambos valores de p y q por igual.

No hay comentarios:
Publicar un comentario