Amint azt fentebb a Becslés című részben említettük, a statisztikai következtetés az a folyamat, amelynek során egy mintából származó adatok felhasználásával becsléseket készítünk vagy hipotéziseket tesztelünk a sokaságról. A mintavételes felmérési módszerek területe a mintavételi adatok megszerzésének hatékony módjaival foglalkozik. A mintavételes felmérések három leggyakoribb típusa a postai, a telefonos és a személyes interjúkkal végzett felmérések. Ezek mindegyike kérdőív használatával jár, amelyre vonatkozóan a kérdések megfogalmazására, sorrendjére és csoportosítására vonatkozóan számos ismeretanyag áll rendelkezésre. Vannak más típusú mintavételes felmérések is, amelyek nem tartalmaznak kérdőívet. Például a számviteli nyilvántartások könyvvizsgálat céljából történő mintavételezése és a számítógép használata egy nagy adatbázis mintavételezéséhez olyan mintavételes felmérések, amelyek a mintavételezett egységek közvetlen megfigyelését használják az adatgyűjtéshez.
A mintavételes felmérések tervezésének célja, hogy olyan mintát kapjunk, amely reprezentatív a sokaságra nézve, hogy pontos következtetéseket lehessen levonni. A mintavételi hiba a populációs paraméter és az annak becslésére használt mintavételi statisztika közötti különbség. Például a populáció átlaga és a minta átlaga közötti különbség a mintavételi hiba. A mintavételi hiba azért fordul elő, mert nem a teljes sokaságot, hanem annak egy részét vizsgálják. A valószínűségi mintavételi módszerek, amelyeknél a mintában megjelenő egyes egységek valószínűsége ismert, lehetővé teszik a statisztikusok számára, hogy valószínűségi kijelentéseket tegyenek a mintavételi hiba nagyságáról. A nem valószínűségi mintavételi módszereket, amelyek nem valószínűségen, hanem kényelmi vagy megítélésen alapulnak, gyakran alkalmazzák költség- és időelőnyök miatt. A nem valószínűségi mintából történő következtetések levonásakor azonban rendkívül óvatosnak kell lenni; az, hogy a minta reprezentatív-e vagy sem, a felmérést tervező és végző személyek megítélésétől függ, nem pedig a megalapozott statisztikai elvektől. Ezenkívül nincs objektív alap a mintavételi hiba határainak megállapítására, ha nem valószínűségi mintát használtak.
A legtöbb kormányzati és szakmai közvélemény-kutatás valószínűségi mintavételt alkalmaz. Általában feltételezhető, hogy minden olyan felmérés, amely plusz vagy mínusz hibahatárról számol be, valószínűségi mintavétellel készült. A statisztikusok előnyben részesítik a valószínűségi mintavételi módszereket, és javasolják, hogy amikor csak lehetséges, ezeket alkalmazzák. Számos valószínűségi mintavételi módszer áll rendelkezésre. Az alábbiakban a leggyakoribbak közül néhányat tekintünk át.
A sok valószínűségi mintavételi módszer alapját az egyszerű véletlenszerű mintavétel adja. Egyszerű véletlen mintavétel esetén minden lehetséges n méretű minta ugyanolyan valószínűséggel kerül kiválasztásra. Ezt a módszert fentebb a Becslés című részben tárgyaltuk.
A rétegzett egyszerű véletlen mintavétel az egyszerű véletlen mintavétel egy olyan változata, amelyben a sokaságot viszonylag homogén csoportokra, úgynevezett rétegekre osztjuk, és minden rétegből egyszerű véletlen mintát választunk. A rétegekből származó eredményeket ezután összesítik, hogy következtetéseket lehessen levonni a sokaságra vonatkozóan. Ennek a módszernek az a mellékhatása, hogy az egyes rétegek által képviselt részpopulációra is lehet következtetéseket levonni.
A klaszteres mintavétel során a populációt külön csoportokra, úgynevezett klaszterekre osztják fel. A rétegzett egyszerű véletlen mintavételezéssel ellentétben kívánatos, hogy a klaszterek heterogén egységekből álljanak. Az egylépcsős klasztermintavétel során a klaszterekből egyszerű véletlenszerű mintát választanak ki, és a mintavételezett klaszterek minden egységétől adatokat gyűjtenek. A kétlépcsős klasztermintavétel során a klaszterekből egyszerű véletlenszerű mintát választanak ki, majd az egyes mintavételezett klaszterek egységeiből egyszerű véletlenszerű mintát választanak ki. A klaszteres mintavétel egyik elsődleges alkalmazása az úgynevezett területi mintavétel, ahol a klaszterek megyék, települések, városrészek vagy a népesség más jól meghatározott földrajzi részei.