Stel: je onderzoekt de kenmerken van ‘de huurder’ in Nederland. Je zou dan graag alle woninghuurders een vragenlijst willen toesturen. Dat is echter duur, meestal niet mogelijk, maar ook niet noodzakelijk. Weet je van een paar honderd huurders hoe ze hun woning waarderen, dan kun je – rekening houdend met een marge – ook iets zeggen hoe alle huurders in Nederland daarover denken. Door het meten van kenmerken bij een beperkt deel van alle objecten kan je al relevante uitspraken doen over die kenmerken van alle objecten in de populatie. Belangrijk daarbij is dat de steekproef representatief moet zijn.
Waarom is representativiteit belangrijk?
Zijn de gegevens die je analyseert van de respondenten representatief voor de gehele populatie, dan gelden deze resultaten, rekening houdend met een bepaalde betrouwbaarheidsmarge, voor de gehele populatie. Als echter de respons niet representatief is voor het totaal, dan mag je de resultaten niet laten gelden voor de gehele populatie. Het gaat dus niet om de representativiteit van de steekproef, maar om de representativiteit van de respons. Het trekken van een representatieve steekproef is goed te doen, maar ervoor zorgen dat je een representatieve respons hebt, is veel lastiger.
Van populatie naar respons
De term ‘steekproef’ is nauw verbonden met de populatie. De populatie is de groep waarover je iets wilt weten. In deze blog is de populatie ‘de huurder’ in Nederland. Maar wat is ‘de huurder’ precies? Zijn dit alle huurders van een pand in Nederland? Of alleen huurders van woningen? Bestaan de woningen alleen uit eengezinswoningen, of horen daar ook etage- en vrijstaande woningen bij? Zijn het de huurders in alle leeftijdscategorieën of alleen de huurders van 65 jaar en ouder? De populatie moet dus goed omschreven worden, bijvoorbeeld als ‘huurders, in alle leeftijdscategorieën, van woningen bestaande uit de volgende typen: eengezins-, etage-, vrijstaande woningen…’. Als je een steekproef gaat trekken moeten er dus huurders uit alle benoemde typen tussen zitten.
De volgende stap is het selecteren van de huurders die tot je omschreven populatie behoren. Waarschijnlijk is er geen lijst met alle huurders van woningen in Nederland. Je moet dus een manier vinden om uit huurders een steekproef te halen. Wellicht kan dit via een databroker die een bestand heeft van alle huurwoningen in Nederland. Zo’n bestand heet het steekproefkader. Uit het steekproefkader trek het aantal gewenste elementen. Het resultaat is de bruto steekproef. Eventuele fouten, bijvoorbeeld dubbele adressen, haal je eruit. Wat overblijft is de netto steekproef. De personen op de geselecteerde adressen benader je met de vraag of ze willen meedoen aan je onderzoek. Iedereen die ja zegt, is een respondent. Dit is de bruto respons. Waarschijnlijk zal niet iedereen, die heeft aangegeven mee te willen doen, de vragenlijst invullen. De groep die de vragenlijst daadwerkelijk heeft ingevuld, heet de netto respons.