Pasos para realizar el muestreo (parte 2)
Cálculo del tamaño de la muestra
En el muestreo aleatorio simple los factores que determinan el tamaño de la muestra son el error de muestreo, la varianza, el tipo de muestreo y el nivel de confianza.
Además, se tienen en cuenta las estimaciones que se van a hacer: medias, totales, proporciones, así como el tamaño del universo del cual se extrae la muestra.
Distinguimos las fórmulas referidas a universos pequeños o poblaciones finitas de aquellas referidas a universos grandes o poblaciones infinitas.
Se consideran en la práctica poblaciones o universos finitos a aquellos de un tamaño inferior a 100.000 elementos. (En las poblaciones infinitas la fracción de muestreo n/N es pequeña).
Fórmulas para el cálculo del tamaño de la muestra
n = tamaño de la muestra
N = tamaño del universo
K = nivel de confianza
σ = cuasivarianza de la población, que se sustituye por la de la muestra S²
e = error de muestreo
P = proporción de una categoría de variable. Proporción de los que poseen el atributo
Q = (1-P) . Proporción de los que no lo poseen
Fórmula de la cuasivarianza: S² = Σ (xi – x)² / n-1
Población finita o universo pequeño
Tamaño de la muestra para estimar:
Población infinita o universo grande
A la vista de las fórmulas, puede decirse que:
- El tamaño de la muestra es muy sensible al nivel de precisión requerido. Para obtener un error la mitad, haría falta una muestra no doble, sino cuatro veces mayor. Si hacemos los cálculos con un nivel de confianza del 95,5% (K=2) y en el caso más desfavorable p=q=50%, podemos ver la relación entre el error y el tamaño de la muestra.
2. La homogeneidad o heterogeneidad de la variable tiene influencia decisiva sobre el tamaño de la muestra para un error dado.
3. El tamaño del universo, salvo en universos pequeños, no influye en el tamaño de la muestra.
Cálculo del error de muestreo
Población finita o universo pequeño
Tamaño de la muestra para estimar:
Población infinita o universo grande
Estimaciones puntuales y por intervalo
La estimación puntual consiste en asignar un único valor como estimación del parámetro; esta estimación se utiliza cuando queremos conocer el valor concreto de un parámetro poblacional y no disponemos de este valor.
Las estimaciones puntuales se obtienen de una forma sencilla utilizando las siguientes fórmulas:
Fórmulas estimaciones puntuales
La estimación por intervalo consiste en calcular un intervalo que contenga entre sus límites, con cierta probabilidad, el verdadero valor del parámetro poblacional. Este intervalo se llama Intervalo de confianza.
La estimación puntual, los errores de muestreo y los niveles de confianza permiten acotar los intervalos de probabilidad en los que se hallan los parámetros. Es decir los límites entre los que se encuentran los valores que se pretende estimar. El uso del intervalo añade a la estimación puntual los límites de su posible desviación con respecto al valor estimado.
Fórmulas estimaciones por intervalo
u = límites de confianza
xi = valores estimados: media, total, proporción.
e = error de muestreo
K = nivel de confianza
u = xi +/- K.e
¿Cómo hay que interpretar los datos con el margen de error y las estimaciones por intervalo?
Imaginemos que se ha realizado una encuesta con 100 entrevistas, el valor del margen de error sería de ± 10 (para k=2 y p=q=50%).
Supongamos que hemos hecho una estimación de un porcentaje y ha resultado ser del 50%. La lectura del dato estimado es que, el valor del 50% que hemos hallado en la muestra, dentro del universo, podría oscilar entre 60 y 40 — es decir entre (50 + 10) y (50 – 10)— con el 95,5% de probabilidad o dicho de otro modo en 95,5 de cada 100 veces; Si se quiere reducir este intervalo, la solución es ir ampliando el tamaño de la muestra, para que disminuya el error.
El coeficiente de variación
Es una medida que nos permite valorar la precisión de una estimación. Expresa en términos relativos la desviación típica ponderándola por el valor medio al que hace referencia. Los coeficientes de variación presentan los errores de muestreo en porcentajes de la estimación, lo que facilita la interpretación de los resultados y la comparación entre estimaciones.
Sirven también para comparar distintos parámetros.
Fórmula para el cálculo del coeficiente de variación
Definición de términos
Cv = coeficiente de variación
σ = desviación típica que se sustituye por el error obtenido.
xi = valores estimados: media, total, proporción.
Cv = σ / xi
Muestreo estratificado y errores de muestreo
Cuando el muestreo es estratificado, siempre que los estratos sean independientes, el error de muestreo se reduce con respecto al de un muestreo aleatorio simple.
La varianza de la estimación será la suma ponderada de las varianzas de la estimación de cada estrato. Por lo tanto se deben calcular las varianzas de la estimación por estrato, de manera independiente, para agregarlas después de acuerdo al peso del estrato.
Cálculo del error en un muestreo estratificado
Definición de términos
Sp² = varianza
Wh = fracción de la población del estrato sobre el universo
Ph = proporción de la categoría de la variable en el estrato.
nh = elementos de la muestra en el estrato
Te puede interesar leer:
Pasos para realizar el muestreo (parte 1)
El muestreo y tipos de muestreo
Originally posted 2022-01-07 13:05:15.