Hoofdstuk 1. Introductie
Het verzamelen van informatie vormt de kern van alle wetenschappen en levert de waarnemingen die
worden gebruikt in statistische analyses. De verzamelde observaties over de kenmerken van belang
worden gezamenlijk data genoemd.
Statistiek in een veel bredere zin - als een wetenschap die ons manieren geeft om gegevens te
verkrijgen en te analyseren.
In het bijzonder biedt statistische wetenschap methoden voor:
- Ontwerp: plannen hoe gegevens te verzamelen voor een onderzoek studie om vragen te
onderzoeken voor ons interessant.
Design verwijst naar het plannen van een onderzoek, zodat de gegevens die het oplevert
informatief zijn. Voor een enquête specificeert het ontwerp bijvoorbeeld hoe de mensen
moeten worden geselecteerd om te interviewen en stelt het
de vragenlijst samen die aan die mensen moet worden afgenomen.
- Beschrijving: een samenvatting van de gegevens die in het onderzoek zijn verkregen.
Verwijst naar het samenvatten van gegevens, om de informatie die de
gegevens bieden te helpen begrijpen.
Grafieken, tabellen en numerieke samenvattingen zoals gemiddelden en percentages worden
beschrijvende statistiek genoemd. We gebruiken beschrijvende statistieken om de
gegevens terug te brengen tot een eenvoudiger en begrijpelijker vorm zonder veel informatie
te vervormen of te verliezen.
- Inferentie: voorspellingen doen op basis van de gegevens, om ons te helpen op een
objectieve manier met onzekerheid om te gaan.
Voorspellingen gemaakt met behulp van gegevens worden statistische gevolgtrekkingen
genoemd.
Populaties en steekproeven
De entiteiten waarop een onderzoek waarnemingen doet, worden de voorbeeldonderwerpen voor
het onderzoek genoemd. De populatie is de totale set van onderwerpen die van belang zijn in een
onderzoek. Een steekproef is de subset van de populatie waarover de studie gegevens verzamelt.
Beschrijvende statistieken vatten de informatie samen in een verzameling gegevens. Beschrijvende
statistieken bestaan uit grafieken, tabellen en getallen zoals gemiddelden en percentages.
Beschrijvende statistieken reduceren de gegevens tot eenvoudiger en begrijpelijker vorm zonder veel
informatie te vervormen of te verliezen.
Hoewel gegevens meestal alleen voor een steekproef beschikbaar zijn, zijn beschrijvende statistiek
ook nuttig wanneer gegevens voor de gehele populatie beschikbaar zijn, zoals bij een volkstelling.
Daarentegen zijn inferentiële statistieken van toepassing wanneer gegevens alleen beschikbaar zijn
voor een steekproef, maar we een voorspelling willen doen over de gehele populatie. Voorspellingen
doen over een populatie, op basis van gegevens uit een steekproef van die populatie.
Inferentiële statistische analyses kunnen kenmerken van populaties goed voorspellen door
steekproeven te selecteren die klein zijn in verhouding tot de populatiegrootte. Dat is de reden
waarom veel peilingen slechts ongeveer duizend mensen bemonsteren, zelfs als de bevolking
miljoenen mensen heeft.
,Samenvatting Statistiek 1
Parameters en statistiek
Een beschrijvende statistiek is een numerieke samenvatting van de voorbeeldgegevens. De
bijbehorende numerieke samenvatting voor de populatie wordt een parameter genoemd. Een
parameter is een numerieke samenvatting van de populatie. Een belangrijk aspect van statistische
gevolgtrekking is het rapporteren van de waarschijnlijke precisie van de steekproefstatistiek die de
populatieparameter schat. Als er gegevens zijn voor een hele populatie, zoals in een volkstelling, is
het mogelijk om te vinden de waarden van de parameters van belang. Dan is het niet nodig om
inferentiële te gebruiken statistische methoden.
Conceptuele populatie
Soms verwijzen de generalisaties echter naar tot een conceptuele populatie - een die niet echt bestaat
maar hypothetisch is. Beschrijvende basisstatistieken vergelijken longkankerpatiënten die de nieuwe
behandeling krijgen aan andere longkankerpatiënten die in plaats daarvan een standaardbehandeling
krijgen, gebruikmakend van de percentages die positief reageren op de twee behandelingen. Bij het
toepassen van inferentiële statistische methoden zouden de onderzoekers: idealiter zoals
gevolgtrekkingen om te verwijzen naar de conceptuele populatie van alle mensen die lijden van
longkanker nu of op enig moment in de toekomst.
Spss
Statistische software analyseert gegevens die zijn georganiseerd in de spreadsheetvorm van een
gegevensbestand:
• Elke rij bevat de observaties voor een bepaald onderwerp (bijvoorbeeld persoon) in de steekproef.
• Elke kolom bevat de waarnemingen voor een bepaald kenmerk.
Onjuiste analyses ontstaan wanneer onderzoekers onvoldoende tijd nemen om te begrijpen de
statistische methode, de aannames voor het gebruik ervan of de geschiktheid ervan voor het
specifieke probleem. Het is essentieel om de methode te begrijpen voordat u deze gebruikt. Gewoon
weten het gebruik van statistische software biedt geen garantie voor een goede analyse. Je hebt een
nodig goede achtergrond in statistieken om te begrijpen welke methode te selecteren, welke opties te
kiezen in die methode, en hoe je geldige conclusies kunt trekken uit de output.
,Samenvatting Statistiek 1
Hoorcollege 1.1
Kansrekening vs statestiek
Kansrekening – gaat veelal over deductie (weet al hoe een bepaalde populatie eruitziet, op basis van
die kennis kunnen er algemene uitspraken worden gedaan). Van algemeen naar specifiek. Gegeven
dat we alle details weten van een bepaalde populatie, hoe waarschijnlijk is dan een bepaalde
(steekproef-)uitkomst? (i.e. algemeen -> specifiek). Op basis van de gegevens die je hebt kun je
uitspraken doen over de waarschijnlijkheid van specifieke voorvallen. Welke data valt de verwachten
voor de populatie als we gegevens uit een bepaalde steekproef trekken?
Algemeen Specifiek
Populatie Steekproef
Model Data
Statistiek - gaat veelal uit van inductie, dwz. gegeven een bepaalde (steekproef-) uitkomst, wat
kunnen we dat met welke waarschijnlijkheid zeggen over de populatie? (specifiek -> algemeen).
Wereld om ons heen beter begrijpen. Wat zal in het algemeen waar zijn? Op basis van steekproef
uitspraken te doen over de doelpopulatie. Grotere groepen generaliseren. Data gebruiken om
uitspraken te doen over het model.
Algemeen Specifiek
Populatie Steekproef
Model Data
Overeenkomsten tussen statestiek en kansberekening
Invloed van toevalligheid (randomness)
Statistische technieken worden gebruikt om hele populatie te beschrijven (gaat merendeels
over een steekproef)
Sommige statistische technieken maken eerst bepaalde aannames over de populatie om
vervolgens op basis van een steekproef te bepalen hoe onwaarschijnlijk het is dat de
aannames opgaan.
Beslisregel in het trekken van conclusies aangaande een populatie op basis van een
steekproef is gebaseerd op weerleggen, oftewel falsificatie:
“Als het onwaarschijnlijk is dat hypothese opgaat, dan verwerpen we dat het waar is.”
Beschrijvende statistieken vatten steekproef- of populatiegegevens samen met getallen, tabellen en
grafieken
Inferentiële statistieken doen voorspellingen over populatieparameters op basis van
steekproefgegevens.
Methodologie: Systematische wijze van hoe je (empirisch) onderzoek zou moeten uitvoeren.
Manieren hoe je bepaald onderzoek zou moeten uitvoeren (via design). Hoe voer je goed onderzoek
uit. (Plan van aanpak voor onderzoek)
Statistiek: Het instrumentarium om empirisch onderzoek uit te kunnen voeren (tools om onderzoek uit
te voeren)
Onderzoeksvraag
Q: Hoe kunnen we succes in statistiekonderwijs verhogen?
Onderzoeken met behulp van data: observaties van karakteristieken
populatie: de totale set van deelnemers, relevant voor de onderzoeksvraag
- vbpopulatiegrootheid (parameter): gemiddeld aantal uren online zelfstudie per week
, Samenvatting Statistiek 1
steekproef: een deel van de populatie waarover data verzameld is (representatief lijkt op de
populatie)
- vbsteekproefgrootheid (statistic): gemiddeld aantal uren online zelfstudie per week
Goede data nodig om deze onderzoeksvraag te beantwoorden:
Betrouwbaar: als de methode opnieuw zou uitvoeren, hier dezelfde uitkomsten naar voren moeten
komen.
Valide: gemiddelde uit steekproef, ook echt representatief is voor de populatie als geheel. Zegt wat ik
toets ook daadwerkelijk iets over wat ik wil meten?
Biased (data komen wel overeen, maar zijn
niet valide. Ik toets niet wat ik werkelijk wil
toetsen).
Grote steekproef die betrouwbaar is en
opnieuw uitgevoerd kan worden. Echter
kloppen de onderzoeksresultaten niet.
‘
Kleine steekproef die onnauwkeurig is.
Gemiddeld genomen wel representatief.
[Trek de aandacht van uw lezer met
een veelzeggend citaat uit het
document of gebruik deze ruimte om
een belangrijk punt te benadrukken.
Sleep dit tekstvak als u het ergens
anders op de pagina wilt plaatsen.]
Weergeeft wat je denkt dat je wil
weergeven. Uitspraak kan
generaliseren. Op basis van
onderzoek kan je betrouwbare en
valide uitspraken doen over de
populatie.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur sirannajanssen. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €9,49. Vous n'êtes lié à rien après votre achat.