Misvattingen en feiten

Bij enkele deskundigen betrokken bij het genoemde rondetafelgesprek kwamen misvattingen voor in hun paper, die ik even kort memoreer, maar die elk voor zich een afzonderlijke Blog zou kunnen vullen. Ik zet er enkele feiten naast.

https://www.tweedekamer.nl/vergaderingen/commissievergaderingen/details?id=2016A05129

Misvattingen van de toetsexpert

1: Het LVS neemt alle kinderen op hetzelfde moment dezelfde toets af om leerlingen vervolgens met elkaar te kunnen vergelijken. Je kunt dus alleen maar vooruit gaan in vergelijking met anderen.

Feit:  De meest gebruikte toetsen in het basisonderwijs zijn die van het Cito-LVS en daarmee moeten leerlingen op maat worden getoetst. Zwakke leerlingen krijgen een andere toets dan sterke leerlingen. Bovendien hebben vele toetsen een adaptief element door een startmodule en een vervolgmodule. Het is dus niet zo dat alle leerlingen op het zelfde moment de zelfde toets moeten maken.

2:  Door de competitieve insteek kan groei niet zichtbaar worden.

Vaardigheidsgroei
Groei in LVS

Feit:  Het Cito- LVS brengt de groei van een leerling in beeld ten opzichte van eerdere metingen. Dat is groei in vaardigheid van die leerling zelf. Daarnaast is er een niveau-indeling gebaseerd op de landelijke normering. Ook daarin kan een leerling van niveau veranderen per meting. En dat gebeurt ook veelvuldig, zowel naar boven als naar beneden.

3: Met meerkeuzevragen kunnen we niet veel meer dan oppervlakkige feitenkennis meten. Even verder wordt gesuggereerd dat de LVS-toetsen, net als de Eindtoets, alleen uit meerkeuzevragen bestaat.

Feit : Met meerkeuzevragen kunnen ook ‘higher order skills’ worden gemeten, zoals verbanden leggen en analytisch denken. Zie bijv. Aiken, 1982 of Kominski, 2012.*  Het LVS bevat ook niet uitsluitend klassieke meerkeuze vragen, maar kent ook kort-antwoordvragen (spellingsdictee), aanstreepvragen en het aantal goed gelezen woorden in een bepaalde tijd (technisch lezen).

Misvattingen van de hoogleraar Pedagogiek

4: Inhoudelijk is er geen duidelijkheid wat precies moet worden bereikt of moet worden nagestreefd. Verderop: er zouden duidelijke minimumdoelen bepaald moeten worden voor het einde van groep 8.

Feit: In Nederland hebben we de kerndoelen en voor rekenen en taal zijn er zelfs vrij exacte Referentieniveaus. De Eindtoetsen moet zich daar aan houden en in de resultaten daarover rapporteren. Bovendien is er een CVTE die de zaak aanstuurt en controleert en zijn er commissies die de inhoud en de vragen vaststellen.

5: De Eindtoets is een momentopname (een eeuwenoud argument, dat zelfs nog steeds door OCW wordt gebruikt om het toetsadvies te relativeren ten opzichte van het schooladvies).

Feit: de Eindtoets vind op meerdere dagen plaats, kan eventueel opnieuw gedaan worden en heeft een hoge voorspellende waarde.

6: Resultaten op de eindtoets worden voornamelijk door leerlingkenmerken veroorzaakt. Daarbij wordt tevens gesuggereerd dat leerkracht en school er niet zo veel toe doen.

Feit: Leerlingkenmerken veroorzaken geen toetsscores, maar vertonen daar een samenhang mee. Van causaliteit is geen sprake: leerlingen uit zwakke milieus kunnen toch hele goede scores halen. De relatie tussen schoolkenmerken (leerkrachtkenmerken) enerzijds en toetsresultaten anderzijds is inderdaad ingewikkeld en doorgaans zwak. Maar er zijn wel degelijk scholen die het met een vergelijkbare leerlingpopulatie veel beter doen dan andere scholen.

7: Het is onduidelijk waar de grens ligt tussen voldoende en onvoldoende en wie die grens bepaalt.

Feit: De Eindtoetsen kennen helemaal geen criterium van voldoende of onvoldoende. Ze geven een advies in 6 tot 8 verschillende brugklastypes in termen van kans op succes in het VO. Wel zijn er referentieniveaus vastgesteld voor 1F en 1S. Dat zijn absolute punten op een vaardigheidsschaal en die heeft een leerling gehaald of niet.

*Literatuur:

Aiken, Lewis R., (1982). Writing multiple-choice items to measure higher-order educational objectives. Educational and Psychological Measurement, 1982, Vol. 42, pp. 803-806.

Kominski, Carol, “Designing Multiple Choice Tests to Measure Higher Order Thinking” (2012).Test Item Writing. Paper 10. http://digitalcommons.hsc.unt.edu/test_items/10