Pasos para realizar el muestreo (parte 1)
Para la recolección de una muestra, muestreo, debemos seguir unos pasos: Definir la población en estudio especificando las unidades que la componen, el área geográfica donde se realiza el estudio (si procede) y el periodo de tiempo en el que se realizará el mismo.
Nombraremos con una N a la población o universo del estudio.
– Definir el marco: si es posible, elaborar un listado o descripción de los elementos que forman la población.
– Definir la unidad de muestreo: Ciudades, calles, hogares, individuos, etc.
– Definir las variables a medir o en su caso, las preguntas que se vayan a hacer si se trata de una encuesta.
– Seleccionar el método de muestreo: probabilístico o No probabilístico
– Calcular el tamaño de muestra n, necesario para obtener una determinada precisión en la estimación.
– Elaborar el plan de muestreo para realizar el trabajo de campo. Cómo se va a proceder para seleccionar los elementos de la muestra.
Afijación de la muestra en el muestreo
La afijación de la muestra es la distribución de las unidades de muestreo entre distintos estratos en que se puede dividir la población objeto de estudio.
Los tipos de afijación son:
- Afijación simple: se trata de asignar a cada estrato un mismo número de entrevistas.
- Afijación proporcional: se distribuyen las unidades de la muestra en función del peso relativo de la población de cada estrato.
- Afijación de compromiso: se impone un tamaño mínimo de muestra al estrato y las entrevistas que restan se reparten proporcionalmente entre todos los estratos restantes según el peso de la población en cada uno.
- Afijación óptima: en esta se tiene en cuenta la homogeneidad o heterogeneidad de la población. Si el estrato es homogéneo la desviación típica es pequeña y por ello se puede tomar una muestra más reducida. Además de la varianza se considera la estratificación por peso de la población en cada estrato.
Nivel de desagregación
A veces se necesitan muestras que permitan hacer estimaciones no sólo de la población total, sino también sobre diferentes subdivisiones del universo o población que se hayan considerado.
El nivel de precisión es diferente para cada caso y los errores de muestreo aumentan conforme disminuye el número de unidades de muestreo. Si las submuestras son pequeñas no se pueden hacer estimaciones con rigor.
Para solucionar este problema se puede:
a) aumentar la muestra total
b) hacer una afijación no proporcional y aumentar la muestra en aquellos estratos que interesa estudiar.
Después es necesaria la ponderación de la muestra.
Ponderación de la muestra
Si se desproporcionan las submuestras y después se quieren tratar los datos conjuntamente hay que proceder a su ponderación para no deformar las estimaciones.
Ponderar es devolver a cada submuestra la proporcionalidad que tiene en la población total.
Uno de los sistemas para ponderar es recurrir al sistema de los elevadores que son N/n.
Con esto conseguimos restituir las proporciones de la muestra según la pauta de la población. Lo normar es utilizar coeficientes de ponderación. Los programas informáticos de tratamiento informático de ficheros incluyen en sus opciones básicas la ponderación para ajustar las muestras.
Ejemplo: Se quiere hacer una muestra de la población de Cataluña….
Estimadores y errores de muestreo
Cuando se realiza una investigación por muestreo se analizan los datos de una muestra n que representan a una población N.
Los datos que se desean estimar de la población suelen ser medias, proporciones, totales o razones. Estos valores se llaman valores verdaderos de la población, o parámetros.
Los datos obtenidos a partir de la muestra, nos permiten estimar unos valores aproximados de la población total. A estos valores aproximados obtenidos de la muestra se les denomina estimaciones y están afectados por los errores llamados errores de muestreo.
A la diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado que deberíamos haber obtenido de la población total (el parámetro correspondiente) se llama error de muestreo.
Aunque para obtener una muestra usásemos siempre el mismo método, cada muestra que tomáramos nos dará un valor distinto de la estimación. Si obtuviéramos todas las muestras posibles, estos valores tendrán una distribución que se llama distribución en el muestreo.
A la diferencia entre el valor verdadero del parámetro poblacional y la media de dichos valores estimados, se le denomina sesgo debido al proceso de estimación.
El concepto de error de muestra
Cualquier tipo de muestreo conlleva alguna clase de error, debido a que no se estudia toda la población, sino una parte de ella, la muestra.
El error que se comete al tomar una muestra, en lugar de la totalidad de la población, se denomina error de muestreo y se puede cuantificar cuando el muestreo es probabilístico.
Este error puede calcularse y acotarse diseñando con rigor la muestra que se necesita para cada estudio.
Las estimaciones que se realizan a partir de una muestra, están afectadas por los errores de muestreo y deben tenerse en cuenta a la hora de interpretar los resultados obtenidos.
La precisión de un estimador hace referencia a la dispersión del estimador del muestreo, es decir, a la magnitud de las desviaciones respecto a la media obtenida por la aplicación repetida del procedimiento de muestreo.
El cálculo del error es sencillo si se tiene en cuenta que los estimadores suelen seguir distribuciones normales.
Una estimación es más precisa cuanto menor sea su error de muestreo. La precisión de las estimaciones que se realicen con la muestra depende del proceso de muestreo y, de forma especial, del tamaño de la muestra.
Tamaño de la muestra
Cuando se hace el diseño de un estudio por muestreo hay que fijar cuál va ser el tamaño de la muestra.
El tamaño de la muestra n, es el número de elementos de la población o universo N que se seleccionan para extraer de ellos la información, que después se va a generalizar.
El tamaño depende del error máximo que se esté dispuesto a admitir en la estimación y del nivel de confianza deseado.
El grado o nivel de confianza de una estimación es, la probabilidad de que, al hacer una estimación, el verdadero valor de la población se encuentre entre dos valores dados, llamados límites de confianza.
Estos límites de confianza vienen definidos por la expresión:
Estimador +/- KσE
O sea, el valor de la población que nosotros queremos estimar, estará comprendido con una probabilidad o nivel de confianza dado, entre los valores que resultan de sumar o restar al valor obtenido del estimador muestral, el error absoluto.
Siendo el error absoluto el producto de un coeficiente K por la desviación estándar o raíz cuadrada de la varianza del estimador.
El valor de K depende de la distribución de los elementos de la población y del grado de confianza requerido.
Si la población se distribuye según una distribución normal, el coeficiente K toma el valor +/-1 para una probabilidad de acertar del 68%, si se trata de una probabilidad del 95.5% entonces K=+/-2 y para el 99.7%, el valor es K=3.
Cuanto más alto es el nivel de confianza más precisión tiene la estimación.
En Ciencias Sociales es frecuente utilizar el 95.5% (K=+/-2)
El nivel de precisión de la muestra se mide por el error de muestreo. Los errores de muestreo que se fijan para el cálculo de la muestra pueden variar según el tema y el grado de precisión requerido en función de los objetivos de la investigación.
Variables que intervienen en la determinación del tamaño de la muestra
- Error de muestreo: es el elemento más importante ya que condiciona y determina el tamaño de la muestra.
- Nivel de confianza: en Estadística es la probabilidad de acertar la realidad en ausencia de sesgos.
Para muchas variables aleatorias la distribución de probabilidad es una curva normal o de Gauss. Por medio de tablas se fija la probabilidad y el nivel de confianza con que se quiere trabajar.
- La varianza poblacional: cuando la población es más homogénea la varianza es menor y se necesita una muestra de menor tamaño para representar a la población.
Conocer la homogeneidad o heterogeneidad de la población es fundamental, ya que cuando aumenta la homogeneidad aumenta, aumenta la precisión de la estimación para un número dado de entrevistas.
Si a priori no se conoce la varianza de la población se recurre a estudios semejantes hechos con anterioridad o a estudios piloto.
Cuando no se conoce la varianza o se pretende estimar parámetros referidos a múltiples cuestiones con distintas varianzas se toma la varianza más desfavorable P=(1-P)=0.5 o en porcentaje 50%.
Lo que supone hacer la muestra más grande y por tanto asumir el mayor coste.
- Tipo de muestreo: El muestreo estratificado es más preciso que el aleatorio simple y el de conglomerados menos. Por lo tanto, para un mismo error muestral y con los mismos niveles de confianza, necesitamos seleccionar más elementos en la muestra por conglomerados, menos en la aleatoria simple y menos aún en la muestra estratificada.
El tamaño del universo para poblaciones muy grandes, el error de muestreo y, por tanto, el tamaño de la muestra asociado a un determinado nivel de error, son independientes del número de elementos de la población.
El tamaño de N sólo influye en el caso de poblaciones finitas o universos pequeños (menores de 100.000 elementos).
La fórmula para calcular el tamaño de la muestra se utiliza para hallar el número de elementos (entrevistas en el caso de una encuesta) necesarios, bajo un supuesto de un determinado valor de la varianza y un nivel de precisión (error de muestreo prefijado).
Te puede interesar leer:
Pasos para realizar el muestreo (parte 2)
El muestreo y tipos de muestreo
Originally posted 2022-01-06 18:13:09.