Como se ha indicado anteriormente en la sección Estimación, la inferencia estadística es el proceso de utilizar los datos de una muestra para realizar estimaciones o probar hipótesis sobre una población. El campo de los métodos de encuesta por muestreo se ocupa de las formas eficaces de obtener datos de la muestra. Los tres tipos más comunes de encuestas por muestreo son las encuestas por correo, las encuestas telefónicas y las encuestas por entrevistas personales. Todas ellas implican el uso de un cuestionario, para el que existe un amplio conjunto de conocimientos sobre la redacción, la secuencia y la agrupación de las preguntas. Hay otros tipos de encuestas por muestreo que no implican un cuestionario. Por ejemplo, el muestreo de registros contables para auditorías y el uso de un ordenador para muestrear una gran base de datos son encuestas por muestreo que utilizan la observación directa de las unidades muestreadas para recopilar los datos.
Un objetivo en el diseño de las encuestas por muestreo es obtener una muestra que sea representativa de la población para poder hacer inferencias precisas. El error de muestreo es la diferencia entre un parámetro poblacional y una estadística muestral utilizada para estimarlo. Por ejemplo, la diferencia entre una media poblacional y una media muestral es un error de muestreo. El error de muestreo se produce porque se ha encuestado a una parte, y no a toda la población. Los métodos de muestreo probabilístico, en los que se conoce la probabilidad de que cada unidad aparezca en la muestra, permiten a los estadísticos hacer afirmaciones probabilísticas sobre el tamaño del error de muestreo. Los métodos de muestreo no probabilístico, que se basan en la conveniencia o en el juicio más que en la probabilidad, se utilizan con frecuencia por las ventajas de coste y tiempo. Sin embargo, hay que tener mucho cuidado al hacer inferencias a partir de una muestra no probabilística; que la muestra sea o no representativa depende del juicio de las personas que diseñan y realizan la encuesta y no de principios estadísticos sólidos. Además, no existe una base objetiva para establecer límites en el error de muestreo cuando se ha utilizado una muestra no probabilística.
La mayoría de las encuestas gubernamentales y profesionales emplean un muestreo probabilístico. Por lo general, se puede suponer que cualquier encuesta que informe de un margen de error de más o menos ha sido realizada utilizando un muestreo probabilístico. Los estadísticos prefieren los métodos de muestreo probabilístico y recomiendan su uso siempre que sea posible. Existe una gran variedad de métodos de muestreo probabilístico. Aquí se revisan algunos de los más comunes.
El muestreo aleatorio simple es la base de muchos métodos de muestreo probabilístico. Con el muestreo aleatorio simple, cada muestra posible de tamaño n tiene la misma probabilidad de ser seleccionada. Este método se discutió anteriormente en la sección Estimación.
El muestreo aleatorio simple estratificado es una variación del muestreo aleatorio simple en la que la población se divide en grupos relativamente homogéneos llamados estratos y se selecciona una muestra aleatoria simple de cada estrato. Los resultados de los estratos se agregan para hacer inferencias sobre la población. Una ventaja adicional de este método es que también se pueden hacer inferencias sobre la subpoblación representada por cada estrato.
El muestreo por conglomerados implica la partición de la población en grupos separados llamados conglomerados. A diferencia del muestreo aleatorio simple estratificado, es deseable que los conglomerados estén compuestos por unidades heterogéneas. En el muestreo de conglomerados de una etapa, se selecciona una muestra aleatoria simple de conglomerados y se recogen datos de cada unidad de los conglomerados muestreados. En el muestreo de conglomerados en dos etapas, se selecciona una muestra aleatoria simple de conglomerados y luego se selecciona una muestra aleatoria simple de las unidades de cada conglomerado muestreado. Una de las principales aplicaciones del muestreo por conglomerados es el llamado muestreo de áreas, en el que los conglomerados son condados, municipios, manzanas u otras secciones geográficas bien definidas de la población.