Statistische analyse en presentatie met R

Een overzicht van R-functies gebruikt in Statistiek II

Auteur

Leila Demarest & Joshua Robison

Publicatiedatum

3 oktober 2025

Voorwoord

Dit boek bevat het R-materiaal voor de cursus Statistiek II.

We hebben het boek in drie delen verdeeld:

Lineaire Statistische Modellen: Dit onderdeel richt zich op het verklaren van de variatie in een continue afhankelijke variabele met behulp van lineaire statische analyses, in het bijzonder de regressieanalyse.
Logistische Regressiemodellen: Dit onderdeel richt zich op het voorspellen van een binaire afhankelijke variabele met logistische regressieanalyse.
Interacties in Lineaire en Logistische Modellen: Dit onderdeel richt zich op het gebruik van interactietermen in zowel de lineaire als logistische regressie.

De drie onderdelen presenteren de belangrijkste syntax om de aangeleerde analysemethoden uit te voeren. De syntax wordt stapsgewijs uitgelegd en de logica van de verschillende functies wordt toegelicht. We voorzien de syntax ook van bijkomende commentaar waar nodig (in tekst met grijze achtergrond of in commentaarvakjes die je ziet als je met je computermuis hierop staat). Een voorbeeld:

# Packages
library(tidyverse)   #voor data management en grafieken

# Een linear regressiemodel
model1 <- lm(mpg ~ drat, data = mtcars)

1: Sommige opmerkingen zetten we in deze tekstvakjes, vooral als ze wat langer zijn of wanneer ze zaken die al behandeld zijn herhalen.

Dit overzicht bevat ook algemene richtlijnen over hoe de resultaten van statistische analyses te presenteren en te rapporteren. Je vindt de resultaten (‘output’) van analyses en bijkomende uitleg in volgende tekstvakken:

Output uitleg

In dit vak vind je uitleg over de R output van je analyses.

Interpretatie

In dit vak vind je uitleg over het interpreteren van resultaten (bv. vuistregels over de sterkte van effecten).

Rapportage

✓ Dit vak geeft uitleg over het presenteren van je resultaten aan een breder publiek.

Waarschuwing!

Dit vak wijst op mogelijke problemen die je kunt tegenkomen bij het uitvoeren van de analyse.

Het laatste deel van het boek bevat vijf bijlagen met bijkomende informatie. Appendix A geeft een overzicht van veel voorkomende fouten (‘Common Errors’) bij het uitvoeren van de analyses en bij het omzetten van een R Markdown bestand naar een html bestand (nodig voor de opdrachten). Appendix B geeft een overzicht van de R ‘libraries’ of ‘packages’ (en hun functies) die we gebruiken in deze cursus en de week waarin ze worden geïntroduceerd, en bevat ook het script waarmee je alle packages in 1 keer op je computer kunt installeren. Appendix C bevat de wiskundige formules voor de statistische analyses gebruikt in het handboek. Appendix D bevat informatie over hoe assumptieschendigen opgelost kunnen worden. Dit is geen verplichte leerstof. Appendix E geeft verdere uitleg over hoe je meerdere variabelen kunt combineren in 1 variabele. Dit is geen verplichte leerstof.

Statistiek I Boek

De inhoud van dit boek bouwt verder op de leerstof van Statistiek 1. Data management (bv. filteren, hercoderen van variabelen, ontbrekende waarden aanduiden) blijft ook van belang voor dit vak. Deze leerstof kun je raadplegen in het Statistiek 1 boek. Soms verwijzen we in dit boek ook naar specifieke onderdelen van Statistiek 1 waar dit relevant is.

Overzicht per week

Voor elke week in de cursus moet je relevante hoofdstukken lezen. In 2025-2026 is dit:

Week	Sectie	Hoofdstukken
1	Lineaire Modellen	1 Relaties tussen Continue Variabelen ; 8 Rapporteren en Presenteren van Resultaten (8.2 & 8.3)
2	Lineaire Modellen	2 Bivariate Regressie met Binaire en Categorische Predictoren ; 3 Statistische Significantie ; 5 Voorspellingen en Fouten (5.1 & 5.2) ; 8 Rapporteren en Presenteren van Resultaten (8.4)
3	Lineaire Modellen	4 Meervoudige Lineaire Regressie ; 5 Voorspellingen en Fouten (5.3) ; 6 Model Fit en Modellen Vergelijken ; 8 Rapporteren en Presenteren van Resultaten (8.4 - 8.7)
4	Lineaire Modellen	7 OLS Assumpties
5	Logistische Regressie	9 Logistische Regressie & Odds Ratios ; 10 Marginale Effecten ; 11 Voorspelde kansen ; 14 Rapporteren en Presenteren van Resultaten
6	Logistische Regressie	12 Model Fit en Modellen Vergelijken ; 13 Assumpties van Logistische Regressie
7	Interacties	15 Interacties in het Regressiemodel ; 16 Marginale Effecten in Interactiemodellen ; 17 Voorspelde Waarden van Interactiemodellen