Som nævnt ovenfor i afsnittet Estimation er statistisk inferens en proces, hvor man bruger data fra en stikprøve til at foretage estimater eller teste hypoteser om en population. Inden for området stikprøveundersøgelsesmetoder beskæftiger man sig med effektive metoder til at indhente stikprøvedata. De tre mest almindelige typer af stikprøveundersøgelser er postundersøgelser, telefonundersøgelser og personlige interviewundersøgelser. Alle disse indebærer brug af et spørgeskema, som der findes en stor mængde viden om formulering, rækkefølge og gruppering af spørgsmål. Der findes andre typer stikprøveundersøgelser, som ikke omfatter et spørgeskema. F.eks. er stikprøveudtagning af regnskaber med henblik på revision og brug af en computer til at udtage stikprøver af en stor database stikprøveundersøgelser, hvor der anvendes direkte observation af de enheder, der indgår i stikprøven, til indsamling af data.

Et mål med udformningen af stikprøveundersøgelser er at opnå en stikprøve, der er repræsentativ for populationen, så der kan foretages præcise slutninger. Stikprøvefejl er forskellen mellem en populationsparameter og en stikprøvestatistik, der anvendes til at estimere den. F.eks. er forskellen mellem en befolkningsgennemsnit og et stikprøvegennemsnit stikprøvefejl. Stikprøvefejl opstår, fordi en del og ikke hele populationen er undersøgt. Sandsynlighedsudtagningsmetoder, hvor sandsynligheden for, at hver enhed optræder i stikprøven, er kendt, gør det muligt for statistikere at foretage sandsynlighedsudsagn om størrelsen af stikprøvefejlen. Ikke-sandsynlighedsbaserede stikprøveudtagningsmetoder, som er baseret på bekvemmelighed eller vurdering snarere end på sandsynlighed, anvendes ofte af omkostnings- og tidsmæssige årsager. Man bør imidlertid være yderst forsigtig med at drage konklusioner på grundlag af en ikke-sandsynlighedsstikprøve; hvorvidt stikprøven er repræsentativ eller ej, afhænger af den vurdering, som de personer, der udformer og gennemfører undersøgelsen, har foretaget, og ikke af sunde statistiske principper. Desuden er der ikke noget objektivt grundlag for at fastsætte grænser for stikprøvefejlen, når der er anvendt en ikke-sandsynlighedsstikprøve.

De fleste offentlige og professionelle opinionsundersøgelser anvender sandsynlighedsstikprøver. Det kan generelt antages, at enhver undersøgelse, der angiver en fejlmargin på plus eller minus, er blevet gennemført ved hjælp af sandsynlighedsstikprøver. Statistikere foretrækker sandsynlighedsstikprøveudtagningsmetoder og anbefaler, at de anvendes, når det er muligt. Der findes en række forskellige sandsynlighedsstikprøveudtagningsmetoder. Et par af de mest almindelige gennemgås her.

Simpel tilfældig stikprøveudtagning danner grundlaget for mange sandsynlighedsstikprøvemetoder. Ved simpel tilfældig stikprøveudtagning har alle mulige stikprøver af størrelse n den samme sandsynlighed for at blive udvalgt. Denne metode blev behandlet ovenfor i afsnittet Estimation.

Stratificeret simpel tilfældig stikprøveudtagning er en variation af simpel tilfældig stikprøveudtagning, hvor populationen er opdelt i relativt homogene grupper kaldet strata, og der udtages en simpel tilfældig stikprøve fra hvert stratum. Resultaterne fra strataene aggregeres derefter for at drage konklusioner om populationen. En sidegevinst ved denne metode er, at der også kan drages konklusioner om den delpopulation, som hvert stratum repræsenterer.

Klyngeprøveudtagning indebærer, at populationen opdeles i separate grupper, der kaldes klynger. I modsætning til stratificeret simpel tilfældig stikprøveudtagning er det ønskeligt, at klyngerne er sammensat af heterogene enheder. Ved klyngestikprøveudtagning i et enkelt trin udvælges en simpel tilfældig stikprøve af klynger, og der indsamles data fra hver enhed i de udvalgte klynger. Ved to-trins klyngeudtagning udvælges en simpel tilfældig stikprøve af klynger, hvorefter der udvælges en simpel tilfældig stikprøve af enhederne i hver af de udtagne klynger. En af de primære anvendelser af klyngeprøvetagning kaldes områdeprøvetagning, hvor klyngerne er amter, kommuner, bydele eller andre veldefinerede geografiske dele af befolkningen.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.