Seleccionar correctamente la población que se va a entrevistar es garantizar la fiabilidad de los resultados que se obtendrán.
El líder del estudio rara vez tiene los medios para contactar a todos los miembros de la población que le interesan: los estadísticos lo llaman la "población general". En este caso, realizaría un "censo". Como resultado, debe limitarse a una población más pequeña (= la muestra) que se supone que representa a la población madre y que debería permitirnos generalizar los resultados observados.
En este sentido, la muestra debe ser:
- Precisa: de un tamaño suficiente para que el error de estimación que produce sea aceptable. Una fórmula calcula el error basándose en el tamaño de la muestra.
- Representativa: su composición debe ser similar a la de la población madre.
Método de muestreo y muestra representativa
Existen dos familias principales de métodos: métodos probabilísticos o métodos empíricos.
El método probabilístico (o aleatorio) consiste en seleccionar al azar a los individuos a interrogar de acuerdo con un método que garantiza a todos la misma probabilidad de ser interrogados. Para esto, es necesario tener la lista completa de los miembros de la población general para poder hacer una selección aleatoria real. Por ejemplo, de una lista de personas en una hoja de cálculo y una función de extracción aleatoria de n personas. Este es el método más científico, basado en la "ley de los grandes números" de Bernouilli a fines del siglo XVII, según el cual las características de una muestra aleatoria se aproximan a las características estadísticas de la población cuando aumenta el tamaño de la muestra.
El método empírico consiste en componer la muestra a partir de las características conocidas de la población madre. Sabemos que hay un 52% de mujeres en la población francesa. Queremos una muestra representativa de 500 personas, exactamente 260 mujeres serán entrevistadas. Luego fijamos lo que se conoce como cuotas para recoger respuestas.
Si la muestra no cumple con estos criterios de representatividad, se considera sesgada y será necesario hacer una corrección o completar la encuesta con otras respuestas.
La precisión de una muestra
Si la muestra se extrae al azar, es posible conocer las características de la población a partir de las de la muestra. Esto es una estimación: la información exacta (% o promedio) calculada en la muestra determina el rango o el intervalo de confianza en el que se encuentra el valor correspondiente para la población total. El riesgo de error en la estimación se puede controlar. Cuanto menor sea el riesgo que se quiera tomar, más amplio será el intervalo y más inexacta la estimación.
Para un nivel dado de riesgo, la inexactitud de la estimación depende del tamaño de la muestra y la proporción o desviación estándar observada en la muestra. La precisión aumenta al aumentar el tamaño de la muestra. Las muestras grandes son preferibles a las pequeñas, pero el efecto de aumentar la muestra es cada vez menos sensible.
Finalmente, contrariamente a un error común, la precisión no depende de la frecuencia de muestreo. Por ejemplo, el intervalo de confianza para una muestra de 200 personas es el mismo que la encuesta para la población de París, la población francesa o la población de los Estados Unidos.
El intervalo de confianza de una proporción solo depende de la proporción p observada y del tamaño n de la muestra:
Intervalo de confianza: [p-1.96 * √ (p * (1-p) / n); p + 1.96 * √ (p * (1-p) / n)]
NB: Como se ha reconocido, las reglas anteriores también pueden aplicarse a una muestra que es empíricamente representativa de la población madre según varios criterios.
Calibrado: corregir una muestra
Calibración por supresión
Para recuperar las proporciones esperadas (las de la población general), podemos eliminar aleatoriamente a los encuestados de las categorías sobrerrepresentadas. Esto significa que reduciremos el tamaño general de nuestra muestra y perderemos precisión porque aumentará el error asociado.
Calibración por ponderación
A través de este método, mantendremos todas las respuestas registradas, pero para el recuento, asignaremos a cada encuestado un "peso" en particular según la categoría a la que pertenezca. Este peso es mayor que 1 si su categoría no está suficientemente representada y es menor que 1 si está sobrerrepresentada. Para el recuento de los resultados, la opinión de un individuo ya no pesará 1, sino que tendrá este nuevo peso. Por ejemplo, si tengo la mitad de mujeres que esperaba en mi muestra, el "peso" de una mujer será 2 y la respuesta de cada mujer será el doble.
Este método de recuperación difícilmente se puede implementar sin la ayuda de un software. Para cada categoría, se debe calcular el peso que se utilizará para el ajuste ponderado. Los pesos se aplican a cada conteo considerado. Para cada variable de la encuesta, los números obtenidos por el peso de ajuste de cada categoría se multiplican, y se obtienen nuevas frecuencias "ajustadas".
Muestreo por cuotas
Los procedimientos de recolección por Internet rara vez garantizan un método de selección aleatorio. Por otro lado, permiten contactar rápidamente y a un bajo costo una gran cantidad de interlocutores. Por lo tanto, después de esto, se puede recuperar una muestra representativa según un método aleatorio de acuerdo con cuotas predefinidas.
Además, si el presupuesto lo permite, los proveedores de panelistas en línea (como ToLuna o Bilendi, por ejemplo) ofrecen un servicio de selección de cuotas y generalmente nos permiten obtener la muestra deseada.
Los métodos presentados anteriormente proponen un plan de muestreo a priori, pero también se puede considerar que la muestra se puede extraer retrospectivamente de una gran base de encuestados.
La misma técnica se puede usar para formar una muestra representativa, basada en una gran base de datos de respuestas obtenidas de una muestra de conveniencia. Normalmente, este enfoque se puede utilizar como parte de una encuesta alojada en Internet y distribuida por correo electrónico.
En la mayoría de los proyectos de estudio, es importante definir un muestreo de manera rigurosa. De lo contrario, los resultados observados no podrían generalizarse en ningún caso. Las conclusiones serían inútiles y todos los esfuerzos realizados habrán sido en vano. Tómese el tiempo para comprender completamente las reglas de muestreo y elija el objetivo de los encuestados en consecuencia.
Comments