Vroege selectie: een bijdrage aan de Vlaamse discussie

Herman van de Werfhorst, Universiteit van Amsterdam, h.g.vandewerfhorst@uva.nl 

De discussie over vroege selectie in het onderwijsstelsel wordt momenteel uitgebreid gevoerd in Vlaanderen. Rondom een geplande stelselwijziging, die weliswaar minder wijzigt dan voorzien maar wel degelijk poogt om het selectiemoment uit te stellen, voeren Vlaamse sociologen en psychologen uitgebreide discussie over de vragen (1) of vroege selectie de sociale ongelijkheid versterkt, en (2) of vroege selectie de gemiddelde prestaties bevordert. Immers, voorstanders van vroege selectie wijzen vaak op de betere prestaties die hiermee kunnen worden gerealiseerd, terwijl tegenstanders wijzen op de grotere ongelijkheid naar sociaal en etnisch milieu. Mochten beide vragen positief worden beantwoord is er een zogenaamde trade-off tussen gelijkheid en efficiëntie, waarbij meer efficiëntie (lees: betere leerprestaties over de hele linie) gerealiseerd kan worden ten koste van de gelijke kansen. Of andersom geformuleerd; meer gelijkheid kan worden bereikt als men zich tevreden stelt met een verlaging van de gemiddelde prestaties.

In een reviewstudie [paywall] uit 2010 bespraken we de landenvergelijkende literatuur en concluderen dat ten aanzien van sociale ongelijkheid de literatuur helder is: in landen waar vroeger wordt geselecteerd (bijvoorbeeld Duitsland, Nederland, België) zijn de sociale verschillen in leerprestaties gemiddeld groter dan in landen waar later wordt geselecteerd (bijv. Scandinavië). Dat is zo na controle voor relevante landkenmerken, gebruik makend van verschillende datasets en verschillende verzamelingen van landen. Een uitstekende uitgebreide studie [paywall] van verschillende onderwijsuitkomsten, geschreven door de economen Brunello & Checchi, toont hetzelfde aan. Echter, er is nauwelijks bewijs voor de zogenaamde trade-off, omdat de gemiddelde prestaties in een land niet lijken samen te hangen met de mate van selectie in het lager secundair onderwijs. Vroege selectie heeft dus wel de nadelen, maar niet de voordelen.

Een recent genuanceerd rapport van de Vlaamse psycholoog Wim van den Broeck bespreekt de discussie, en voert enkele nieuwe analyses uit. Een belangrijk punt in de Vlaamse discussie is of er voor intelligentie wordt gecontroleerd in de analyse van de effecten van sociaal-economische status van de ouders (SES) op de track die men kiest en de leerprestaties die men later heeft. Zoals boven geschetst staat de trade-off tussen gelijkheid en efficiëntie centraal in het veld, en de stelling van Van den Broeck dat de discussie alleen gaat over de hellingshoek tussen SES en toetsscore, en niet over de gemiddelde prestaties, is simpelweg niet waar. Tegelijkertijd verdient de gedachte dat ook goede gemiddelde prestaties (of prestaties aan de onderkant en bovenkant) op zichzelf een legitiem beleidsdoel zijn.

Volgens het rapport van Van den Broeck zou de sociologische stellingname zijn dat SES ongecorreleerd is met (aangeboren) intelligentie, zodat sociologen kunnen stellen dat ‘totale’ SES-effecten wel degelijk informatie verschaffen in de effecten van omgeving. Deze blog richt zich op de kwestie van intelligentie in de discussie rondom tracking. De essentie van mijn claim is dat de sociologie niet zozeer stelt dat er geen correlatie is tussen SES en intelligentie, maar (1) dat deze correlatie verre van eenduidig kan worden toegewezen aan aangeboren talenten, en (2) dat de sociologie stelt dat zelfs onder kinderen met dezelfde IQ of leerprestaties, kinderen uit verschillende milieus verschillende onderwijscarrières hebben als gevolg van zogenaamde secundaire effecten. En deze effecten ontstaan gemakkelijker als het systeem al vroeg in de levensloop essentiële keuzes afdwingt.

Voor mijn observaties is het belangrijk om de mate van onderwijsongelijkheid te zien als een opsomming van primaire en secundaire effecten. Onderwijsloopbanen bestaan uit een aantal beslissingen die worden genomen. Primaire SES-effecten lopen via sociale verschillen in leerprestaties (of desnoods intelligentie), en secundaire effecten zijn de ‘directe’ effecten op bereikt onderwijsniveau, of de keuze voor de hogere track, of de beslissing om een bepaalde onderwijstransitie te maken. Er is overigens ook nog een tertiair effect dat de effecten van de leraar betreft, maar dat laat ik hier achterwege.

Hier enkele observaties.

  1. Een Nederlandse studie van onderwijscohorten die tussen 1965-1999 zijn ingestroomd in het voortgezet onderwijs (VO) toont aan dat de balans tussen primaire en secundaire effecten nauwelijks is veranderd. Deze studie betreft de keuze voor de hogere stroom in het VO (havo/vwo) versus de lagere stroom (lbo/mavo/vmbo), en er wordt gecontroleerd voor de CITO-toets, de Nederlandse centrale eindtoets basisonderwijs. Zo ongeveer 45 % van het SES effect is secundair, en loopt niet via eerdere leerprestaties. Er zijn simpelweg sociale verschillen in gemaakte keuzes zelfs als rekening wordt gehouden met sociale verschillen in mogelijkheden. Een mooie internationaal-vergelijkend boek is geredigeerd door Michelle Jackson, en het Nederlandse hoofdstuk geschreven door Charlotte Büchner en Rolf van der Velden toont daar ook aan dat de primaire effecten zo’n 60 procent, en de secundaire effecten zo’n 40 procent bedragen.
  2. De psycholoog Rindermann stelt dat de samenhang tussen de verschillende student assessments op nationaal niveau zo groot is dat hij beargumenteert dat PISA, TIMSS en PIRLS toetsen gezien kunnen worden als meetinstrumenten voor general intelligence g. Als dat klopt is niet te onderzoeken of tracking ongelijkheid in de PISA-toets vergroot als we rekening zouden houden met verschillen in aanleg.
  3. Dit punt van Rindermann hebben we overigens betwist in de Annual Review of Sociology 2010 omdat de correlatie op landniveau tussen lees- en wiskundetoetsen binnen dezelfde assessment (PISA) groter is dan de correlatie tussen wiskunde in PISA en wiskunde in TIMSS. Dit wijst erop dat er specifieke eigenschappen worden getoetst in de verschillende assessments die niet zijn te generaliseren tot algemene intelligentie. Er is, met toetsen zoals PISA, TIMSS, PIRLS, en ook intelligentie, geen sprake van een meeteenheid dat bestaat onafhankelijk van de gemeten cognitieve vaardigheden. Dit bijvoorbeeld in tegenstelling tot inkomensongelijkheid; inkomens ‘bestaan’ ook zonder dat we ze meten.
  4. Het behoeft voor psychologen geen betoog dat intelligentie, gemeten naar IQ, sterk stijgt in de loop der tijd. Dit Flynn effect is zodanig dat de gemiddelde geesten van de 50er jaren vandaag de dag een IQ van ver onder de 80 zouden hebben, wat wijst op een mentale achterstand. En de gemiddelde leerlingen van vandaag de dag zouden in de jaren ’50 briljante geesten geweest zijn met hun intelligentietoets.
  5. Beide bovengenoemde punten wijzen op een sterk culturele factor in intelligentie en assessments.
  6. Van den Broeck stelt dat we niet (alleen) naar de samenhang tussen SES en toetsresultaten moeten kijken, maar vooral ook naar ‘resilience’ (veerkracht), dat wordt gedefineerd als het percentage kinderen uit achterstandsmilieus dat desondanks een hoge prestatie weet neer te zetten. Mijn kritiek op deze maat is dat het niet de verschillen binnen landen, maar vooral tussen landen weergeeft, terwijl de verschillen binnen landen vanuit gelijkheidsoogpunt belangrijker zijn. Het Nederlandse ministerie van OCW stelt met enige regelmaat dat de tweede generatie migranten het in Nederland goed doen in vergelijking met andere landen. Dat kan wel waar zijn, maar dat wordt volledig verklaard door de goede prestaties over de hele linie. Als we naar het verschil in PISA-scores kijken tussen migrantenkinderen en kinderen van de meerderheidsbevolking is het verschil niet klein in Nederland.
  7. Van den Broeck stelt zelf terecht dat een correlatie tussen SES en intelligentie op een wederzijdse causaliteit zou kunnen wijzen: “enerzijds kan het behoren tot een lagere SES-klasse leiden tot een iets minder goede intellectuele ontwikkeling, en anderzijds verhoogt een lager IQ de kans te gaan behoren tot een lagere SES-klasse” (p. 5). Dit lijkt me juist. En voor zover intelligentie niet aangeboren is, maar het gevolg van omstandigheden, verdwijnt het probleem dat Van den Broeck schetst met de sociologische assumptie. Immers, het causale model dat dan achter onderwijsloopbanen ligt loopt dan van SES via intelligentie naar schoolprestaties naar schoolcarrières. Waar moet worden opgemerkt dat dit pad niet volledig verklarend is, zie de secundaire SES effecten hierboven.
  8. Dus, als we het over intelligentie hebben, is het lastig om de mate van erfelijkheid te berekenen. Bestaande studies zijn mijns inziens niet overtuigend. Zo wordt bijvoorbeeld onderzoek gedaan naar eeneiige en twee-eiige tweelingen. De mate waarin de  correlatie tussen intelligentie (of schoolprestaties) groter is tussen eeneiige tweelingen dan tussen  twee-eiige zou wijzen op genetische factoren. Echter, het is zeer waarschijnlijk dat eeneiige tweelingen niet alleen genetisch meer op elkaar lijken dan twee-eiigen, maar ook meer met elkaar omgaan, meer gelijkelijk worden behandeld door hun omgeving, etcetera. Nog even los van de kwestie dat tweelingen mogelijk anders worden behandeld door hun omgeving dan eenlingen, waardoor de vraag is of tweelingbevindingen kunnen worden gegeneraliseerd. Meer algemeen geldt dat allerlei sociale factoren een rol spelen in de ontwikkeling van leercapaciteiten/intelligentie, die al in de meest vroege intelligentietoetsen hun weerslag zullen hebben. Slechts in designs waar allerlei betwiste assumpties worden gemaakt wordt een aanzienlijk erfelijke component in intelligentie gevonden. Wanneer de genen zelf worden onderzocht — toch de state-of-the-art methode in erfelijkheidsonderzoek vandaag de dag — blijkt de verklaringskracht enorm beperkt (2 % van de variantie in bereikt onderwijsniveau, zie studie van Dalton Conley e.a. in Science).
  9. Dit gezegd hebbende, hoeven we niet uit te sluiten dat SES en intelligentie samenhangen, niet alleen omdat SES van invloed is op de intelligentietoetsen maar ook omdat, als gevolg van de meritocratiseringstendens in veel westerse landen, de beroepspositie van de ouders in toenemende mate verdeeld is op basis van hun intelligentie. Als een deel van de intelligentie erfelijk is (onafhankelijk van welke proportie), kan dat leiden tot een toenemende overdracht van ongelijkheid. Zie de sociologische klassieker van Christopher Jencks uit 1972 (!).
  10. De stelselvraag over vroege selectie gaat niet zozeer over hoe ongelijkheden tot stand komen (via SES, intelligentie of allebei), maar vooral over de vraag hoe stelsels de micro-processen in gezinnen beïnvloeden. Sam Lucas (Berkeley) stelt dat sociale klassen verschillen in de mate waarin zij bijziend of vérziend zijn bij het maken van onderwijskeuzes. Bijzienden laten zich vooral leiden door korte-termijn motivaties, en huidige leerprestaties, terwijl vérzienden kijken naar de gehele toekomstige onderwijscarrière en de (vroege) beroepsloopbaan die daarop volgt. In mijn eigen werk met Richard Breen (Yale) en Mads Meier Jaeger (Kopenhagen) laten we zien dat time discounting preferences (het hebben van een lange termijn horizon) minder vaak voorkomen onder kinderen uit laag opgeleide milieus, en tegelijkertijd voor hen juist een sterkere correlatie vertonen met de keuze voor academisch onderwijs (versus beroepsonderwijs). Als vroege tracking nadelig is voor gelijke kansen, kan het komen omdat gezinnen die vroeg moeten kiezen verder moeten kunnen kijken dan kinderen die later mogen kiezen. Myopia (bijziendheid) werkt dan nadelig voor gelijke kansen juist als kinderen jong worden geselecteerd.
  11. Als SES niet langer een effect zou hebben op leerprestaties / student assessments als men voor cognitieve vaardigheden/intelligentie controleert, dan nog zullen secundaire effecten blijven bestaan omdat gezinnen verschillende ambitieniveaus hebben, ouders hun invloed aanwenden om  kinderen. Ambities moeten relatief worden gezien ten opzichte van het sociaal milieu, stelt de relative risk aversion theory van Richard Breen en John Goldthorpe. Onder kinderen uit hogere milieus zijn schoolprestaties een minder goede voorspeller van later gemaakte keuzes. Ook als zij relatief slecht presteren zullen zij zo lang mogelijk doorleren om neerwaartse mobiliteit te voorkomen. Kinderen uit lagere milieus daarentegen zullen, bij matige tot gemiddelde prestaties, eerder stoppen omdat zij al eerder neerwaartse mobiliteit hebben voorkomen, en de kosten/batenanalyse nadelig uitpakt voor verdere studie (zie studie door Breen & Yaish in dit boek). Veel hypothesen die uit deze theorie zijn afgeleid worden onderbouwd. Zo laat ons onderzoek zien dat er inderdaad geen sociale verschillen zijn in de wens om neerwaartse mobiliteit te voorkomen, al is uiteraard de startpositie verschillend.
  12. Nog een ander punt betreft de ontwikkeling van intelligentie gedurende de vroege levensloop. Deze ontwikkeling varieert tussen sociale omgevingen los van gezinskenmerken zoals opleiding van de ouders en burgerlijke staat, zo laat deze studie in the American Journal of Epidemiology zien. In deze studie wordt sociale omgeving gedefinieerd door de wijk waarin men woont, maar een vergelijkbare hypothese kan opgesteld worden voor verschillen tussen tracks. Als men in de lagere tracks zit is het aannemelijk dat men, los van eigen intelligentie, lagere leerprestaties heeft, vanwege pygmalion effecten (self-fulfilling prophecies ten aanzien van leercapaciteiten), peer effecten, en een verlaging van de ambities.

Een Nederlandse analyse van het belang van intelligentie en leerprestaties

Als cognitieve capaciteiten/intelligentie een belangrijke verklaring zijn voor de relatie tussen SES en toetsresultaten, hoe zou dan de samenhang tussen de leeftijd van selectie en sociale ongelijkheid kunnen worden verklaard? Dat zou kunnen doordat vroege selectie leerlingen uit achterstandsmilieus in lagere tracks plaatst onafhankelijk van hun intelligentie en toetsresultaten. De Vlaamse psycholoog Wouter Duyck stelt dan ook dat we voor intelligentie moeten controleren als we de sociale ongelijkheid in tracking willen problematiseren. Nu wil het geval dat in Nederland een longitudinaal databestand beschikbaar is, COOL5-18, waarin van leerlingen in groep 5 in 2007/2008 (derde klas in Belgische systeem) een intelligentietoets wordt afgenomen, en van dezelfde leerlingen in groep 8 in 2010/2011 (klas 6) bekend is wat het schooladvies is van de leraar voor het voortgezet onderwijs. Let wel, dit databestand stelt ons (nog) niet in staat om de feitelijke keuze voor stroom in voortgezet onderwijs te onderzoeken, maar enkel het advies van de leraar van de basisschool die tevens degene is die de eindtoets basisonderwijs afneemt.

Het is voor deze exercitie onbelangrijk of SES de oorzaak of het gevolg is van (pregenerationele) intelligentie. Deze data geven ons de mogelijkheid om de partiële regressiecoëfficiënten te berekenen voor (1) SES / opleiding van de ouders, (2) de CITO eindtoets basisonderwijs, en (3) intelligentie/IQ. Ik toon twee verschillende analyses: (A) een decompositie van totale en indirecte effecten van opleiding van de ouders (indirect via CITO en IQ). Voor deze decompositieanalyse maak ik gebruik van de methode van Karlson, Holm & Breen, Sociological Methodology 2012, en (B) een grafische weergave van de resultaten van enkele regressiemodellen met geclusterde data binnen scholen.

(A). Decompositie-analyse: totale en indirecte effecten van ouderlijke opleiding

In onderstaande tabel staan de resultaten. De effecten van de opleiding van de ouders worden sterk gereduceerd door de opname van IQ en de CITO-toets in het model. Het verschil in de log-odds op een havo/vwo advies versus een vmbo-advies tussen kinderen van ouders met een tertiair diploma, en ouders met een lager secundair onderwijsdiploma verschilt 4, leidend tot een odds ratio van 73 (wanneer niet wordt gecontroleerd voor IQ en CITO-score). Wanneer IQ en CITO aan het model worden toegevoegd zien we dat deze odds ratio verkleint van e^79=2.2. Dus, zelfs als kinderen dezelfde CITO-score en IQ hebben, hebben kinderen van hoogopgeleide ouders een meer dan twee keer zo’n grote kansverhouding om een havo/vwo versus vmbo-advies te krijgen als kinderen van lager opgeleide ouders. Nogmaals, we hebben het alleen over het advies; vermoedelijk zijn de sociale verschillen in de feitelijke keuze nog groter.

khb

(B)   Figuren resulterend  uit regressiecoëfficiënten waarin alle variabelen zijn opgenomen.

De logistische regressievergelijkingen kunnen worden samengevat in onderstaand figuur, waar op de x-as een gestandaardiseerde maat van IQ en CITO wordt weergegeven, en op de y-as de voorspelde kans dat men een havo-vwo advies krijgt. De IQ- en CITO-samenhangen worden weergegeven voor ouders met een tertiair diploma (hoge SES) en ouders met minder dan lager secundair onderwijs (lage SES). Allereerst blijkt dat advies sterk samenhangt met de CITO-score; rond de gemiddelde CITO score neemt de kans om een havo/vwo advies te krijgen enorm sterk toe. De samenhang met intelligentie (gecontroleerd voor CITO) verloopt meer gradueel. Dat is niet verwonderlijk, omdat de CITO-toets een van de belangrijkste informatiebronnen is voor de leraar om tot zijn/haar advies te komen.

Wat echter ook uit de figuur blijkt is dat onder kinderen met dezelfde CITO-score, kinderen van hoger opgeleide ouders een grotere kans hebben om havo-vwo advies te krijgen. Die samenhang is het meest helder te zien in het midden van de CITO-verdeling, zo rond de waarde 0 op de gestandaardiseerde schaal. Dus zelfs als we rekening houden met IQ en CITO krijgen kinderen uit hogere milieus een hoger advies dan kinderen uit lagere milieus.

pp

In de volgende figuur wordt iets vergelijkbaars getoond aan de hand van een meer gedifferentieerde score van advies, die door het GION in Groningen is ontwikkeld om te gebruiken als lineaire maat (waarin ook allerlei combinatie-adviezen een score krijgen, zoals havo/vmbo-theoretische leerweg, of vmbo-kader/vmbo-basis – ik neem de negatieve waarde van deze variabele zodat een hoge score een hoger advies betreft). Ook hierin blijkt dat onder kinderen met dezelfde cognitieve capaciteiten en leerprestaties, kinderen van hoger opgeleide ouders een hoger advies krijgen dan kinderen van lager opgeleide ouders.
pols

Conclusie

De essentie van de sociologische theorie over onderwijsongelijkheid is niet dat sociale klassen gelijk zouden zijn voor wat betreft intelligentie of aanleg. De essentie van de sociologische verklaring is dat zelfs onder kinderen met gelijke IQ of leervaardigheden, kinderen uit hogere milieus in hogere tracks terecht komen dan kinderen uit lagere milieus. Deze secundaire effecten zijn sterk, en aangetoond in vele Westerse landen. Inzicht in de primaire en secundaire effecten is uitermate belangrijk voor beleidsdiscussies,omdat beleid gericht op het verminderen van primaire effecten een andere aard heeft dan beleid gericht op de eliminatie van secundaire effecten. Op zich hebben psychologen gelijk dat we, idealiter, intelligentie zouden moeten beschouwen in de studie van sociale ongelijkheid.  Maar nog even los van de vraag of intelligentie erfelijk is het gevolg is van omgeving moet het benadrukt worden dat juist de directe effecten van sociaal milieu, gecontroleerd voor IQ en leerprestaties, belangrijk zijn in de beleidsdiscussie.

In deze blog vind ik bevestiging van het belang van secundaire effecten, ook in Nederland van vandaag de dag. De vraag is natuurlijk hoe dat komt, en of het onderwijsstelsel van invloed is op hoe secundaire effecten kunnen ontstaan. De sociologische theorievorming hierover is nog niet uitontwikkeld, maar een bruikbare ontwikkelingslijn lijkt me de notie dat sociale klassen verschillen in de mate waarin zij de gehele toekomstige onderwijsloopbaan kunnen overzien. Deze verschillen zullen het meest pregnant naar voren komen in systemen waar de vooruitziende blik nog langer moet zijn dan in andere systemen – de vroeg selecterende systemen.