Wie bereits im Abschnitt Schätzung erwähnt, ist die statistische Schlussfolgerung der Prozess der Verwendung von Daten aus einer Stichprobe, um Schätzungen vorzunehmen oder Hypothesen über eine Grundgesamtheit zu testen. Der Bereich der Stichprobenerhebungsmethoden befasst sich mit effektiven Methoden zur Gewinnung von Stichprobendaten. Die drei gängigsten Arten von Stichprobenerhebungen sind Postumfragen, Telefonumfragen und persönliche Befragungen. Bei all diesen Erhebungen wird ein Fragebogen verwendet, für den ein umfangreiches Wissen über die Formulierung, Abfolge und Gruppierung von Fragen existiert. Es gibt auch andere Arten von Stichprobenerhebungen, die keinen Fragebogen beinhalten. Beispielsweise sind die Stichprobenerhebung von Buchhaltungsunterlagen für Prüfungen und die Verwendung eines Computers zur Stichprobenerhebung einer großen Datenbank Stichprobenerhebungen, bei denen die Daten durch direkte Beobachtung der Stichprobeneinheiten erhoben werden.
Ein Ziel bei der Gestaltung von Stichprobenerhebungen ist es, eine für die Grundgesamtheit repräsentative Stichprobe zu erhalten, so dass genaue Schlussfolgerungen gezogen werden können. Der Stichprobenfehler ist die Differenz zwischen einem Populationsparameter und einer Stichprobenstatistik, die zu seiner Schätzung verwendet wird. Die Differenz zwischen dem Mittelwert der Grundgesamtheit und dem Mittelwert der Stichprobe ist beispielsweise der Stichprobenfehler. Ein Stichprobenfehler tritt auf, weil ein Teil und nicht die gesamte Grundgesamtheit befragt wird. Mit Hilfe von Wahrscheinlichkeitsstichprobenverfahren, bei denen die Wahrscheinlichkeit des Auftretens jeder Einheit in der Stichprobe bekannt ist, können Statistiker Wahrscheinlichkeitsaussagen über die Größe des Stichprobenfehlers machen. Nichtwahrscheinlichkeitsstichprobenverfahren, die eher auf Bequemlichkeit oder Urteilsvermögen als auf Wahrscheinlichkeit beruhen, werden häufig aus Kosten- und Zeitgründen eingesetzt. Man sollte jedoch äußerst vorsichtig sein, wenn man aus einer Nicht-Wahrscheinlichkeitsstichprobe Rückschlüsse zieht; ob die Stichprobe repräsentativ ist oder nicht, hängt von der Einschätzung der Personen ab, die die Erhebung planen und durchführen, und nicht von soliden statistischen Grundsätzen. Darüber hinaus gibt es keine objektive Grundlage für die Festlegung von Grenzen des Stichprobenfehlers, wenn eine Nicht-Wahrscheinlichkeitsstichprobe verwendet wurde.
Die meisten staatlichen und professionellen Meinungsumfragen verwenden Wahrscheinlichkeitsstichproben. Es kann im Allgemeinen davon ausgegangen werden, dass jede Umfrage, die eine Fehlermarge von plus oder minus ausweist, mit Wahrscheinlichkeitsstichproben durchgeführt wurde. Statistiker bevorzugen Wahrscheinlichkeitsstichprobenverfahren und empfehlen, diese wann immer möglich zu verwenden. Es gibt eine Vielzahl von Wahrscheinlichkeitsstichprobenverfahren. Einige der gebräuchlichsten werden hier vorgestellt.
Die einfache Zufallsstichprobe bildet die Grundlage für viele Wahrscheinlichkeitsstichprobenverfahren. Bei der einfachen Zufallsstichprobe hat jede mögliche Stichprobe des Umfangs n die gleiche Wahrscheinlichkeit, ausgewählt zu werden. Diese Methode wurde bereits im Abschnitt Schätzung erörtert.
Die geschichtete einfache Zufallsstichprobe ist eine Variante der einfachen Zufallsstichprobe, bei der die Grundgesamtheit in relativ homogene Gruppen unterteilt wird, die als Schichten bezeichnet werden, und aus jeder Schicht eine einfache Zufallsstichprobe ausgewählt wird. Die Ergebnisse aus den Schichten werden dann aggregiert, um Rückschlüsse auf die Grundgesamtheit zu ziehen. Ein Nebeneffekt dieser Methode ist, dass auch Rückschlüsse auf die Teilpopulation gezogen werden können, die durch die einzelnen Schichten repräsentiert wird.
Bei der Cluster-Stichprobe wird die Grundgesamtheit in separate Gruppen unterteilt, die Cluster genannt werden. Anders als bei der geschichteten einfachen Zufallsstichprobe ist es wünschenswert, dass die Cluster aus heterogenen Einheiten bestehen. Bei einstufigen Cluster-Stichproben wird eine einfache Zufallsstichprobe von Clustern ausgewählt, und die Daten werden von jeder Einheit in den beprobten Clustern erhoben. Bei der zweistufigen Cluster-Stichprobe wird eine einfache Zufallsstichprobe von Clustern ausgewählt und anschließend eine einfache Zufallsstichprobe aus den Einheiten in jedem beprobten Cluster gezogen. Eine der wichtigsten Anwendungen von Cluster-Stichproben ist die sogenannte Flächenstichprobe, bei der die Cluster Landkreise, Gemeinden, Stadtteile oder andere genau definierte geografische Teile der Bevölkerung sind.