“Bij die praktijk komen alleen maar hoogbegaafde kinderen vandaag. Klopt dat wel?”

Vertrouwen in cijfers:
Hoe betrouwbaar de KIQT+ is en hoe we dat monitoren
Over integriteit en betrouwbaarheid van de KIQT+

In december 2025 is door het College van Toezicht van de NVO een tuchtrechtelijke uitspraak gepubliceerd over een zaak die ons raakt. Een orthopedagoog heeft bij het gebruik van de KIQT+ systematisch scores gemanipuleerd en verhoogd. De NVO oordeelde dat de beroepscode ernstig is geschonden door deze orthopedagoog en legde een schorsing op.

In het nieuwsbericht op de NVO website is onder andere het volgende te lezen:

Het College stelt voorop dat pedagogen, als zij bij diagnostiek gebruik maken van gevalideerde en gestandaardiseerde instrumenten zoals een intelligentietest, zij deze instrumenten op de daartoe geëigende manier inzetten en gebruiken. Deze instrumenten zijn immers juist bedoeld om diagnostiek te objectiveren.

De pedagoog heeft door de testresultaten te verhogen in strijd gehandeld met deze norm.

De aankondiging, die ook in de nieuwsbrief naar NVO leden zal worden verzonden, is hier in te zien. De volledige uitspraak kun je hier inzien.

Bij SCALIQ geloven we dat transparantie de basis is van vertrouwen, daarom in dit artikel wat meer over de betrouwbaarheid van de KIQT+ en de achtergrond van dit onfortuinlijke incident.

Wat gebeurde er?

Onze reguliere metadata-analyse bracht een opvallend patroon in beeld. Bij één praktijk zagen we bij 11 afnames dubbele invoer van antwoordpatronen. Niet zomaar willekeurige dubbele invoer: de tweede invoer leidde systematisch tot verhoogde scores. Meestal net boven de magische grens van 130, de drempel voor hoogbegaafdheid.

Dit incident was een uitzondering. Eén persoon, één praktijk.

Voor ons was het geen verrassing dat zoiets kan gebeuren. Waar mensen zijn, is druk. Waar druk is, kunnen verkeerde keuzes worden gemaakt. Wat wél essentieel is: dat we het detecteren en opvolgen. We vinden de betrouwbaarheid voor de kinderen om wie het gaat – en hun gezinnen en scholen – van enorm groot belang.

Onze kwaliteitscontroles

Onze database met KIQT+ afnames wordt voortdurend verbeterd en we waken over de integriteit en betrouwbaarheid van diagnostiek.

Wat we doen:

Patronen analyseren – deze helpen ons om de betrouwbaarheid en normering op het hoogste niveau mogelijk te houden
Anomalieën detecteren – tijdsintervallen tussen invoeren, frequentie van herinvoer, systematiek in scorewijzigingen
Afwijkingen signaleren – zonder de individuele privacy van alle geteste kinderen te schenden, door alleen casussen te bekijken die afwijkend zijn.

Denk aan een brandmelder in je huis. Die geeft niet constant de luchtkwaliteit weer, maar slaat alarm zodra er een afwijkend patroon ontstaat. Onze procedure doet hetzelfde: het monitort voortdurend het gebruik van de KIQT+, helpt zonder te ‘piepen’ met de doorlopende normering en betrouwbaarheid, maar slaat alarm wanneer patronen afwijken van wat normaal is.

Een enkele herinvoer? Kan een legitieme correctie zijn. Systematische verhogingen rond bepaalde grenswaardes? Daar gaat de rode vlag omhoog, en kijken we verder.

Waarom de KIQT+ betrouwbaar is en blijft

Dit is cruciaal om te begrijpen: de manipulatie vond plaats ná de testafname, bij het invoeren van antwoorden in ons systeem. De test zelf deed precies wat deze moest doen: objectief en nauwkeurig meten.

De KIQT+ is gebouwd op wetenschappelijke grondslagen:

1. Hoogbegaafd-proof ontwerp

De KIQT+ is niet zomaar een intelligentietest die ook voor slimme kinderen werkt. Het is een test speciaal ontworpen voor kinderen met een bovengemiddelde intelligentie, tot IQ 170. Dat betekent: geen plafondeffect waarbij hoogbegaafde kinderen “tegen het maximum aanlopen” en we hun werkelijke niveau niet kunnen meten. Van alle kinderen in Nederland en/of Vlaanderen zal slechts 1 op de 769.000 een score van 170+ behalen, en daarmee het plafond van de KIQT+ bereiken.

2. Geavanceerde psychometrie

Waar traditionele tests simpelweg optellen hoeveel vragen goed zijn, gebruikt de KIQT+ Item Response Theory (IRT). Dit betekent dat de test niet alleen kijkt naar het aantal juiste antwoorden, maar naar het patroon van antwoorden in combinatie met de moeilijkheidsgraad van vragen.

Voorbeeld: Een kind dat één makkelijke vraag fout heeft maar een heleboel moeilijke vragen goed? Waarschijnlijk een slordigheidsfout. De IRT-score houdt daar rekening mee. Een kind met een inconsistent patroon? Het systeem signaleert dat de meting niet betrouwbaar is en geeft geen score af.

3. Eerlijk en inclusief

De KIQT+ vermijdt ambiguïteit, gebruikt geen tijdsdruk en test geen eerder opgedane kennis of woordenschat. Waarom? Omdat intelligentie iets anders is dan wat je allemaal al hebt geleerd op school of thuis.

Een hoogbegaafd kind uit een gezin met migratieachtergrond heeft misschien minder Nederlandse woordenschat opgedaan, maar heeft niet per definitie minder cognitief vermogen.

Een kind met autisme presteert mogelijk minder op verbale taken, maar niet op abstract-logisch denken.

De KIQT+ meet wat het moet meten: cognitief potentieel, niet sociale achtergrond en taalvaardigheid.

4. Continue leeftijdsnorm

Kinderen ontwikkelen zich niet in driemaandelijkse blokken. De KIQT+ rekent normen uit tot op de dag nauwkeurig. Een kind dat “net te oud” is voor een leeftijdsinterval wordt niet benadeeld met een score van een paar punten lager IQ.

5. Consistente betrouwbaarheid bij hoge scores

Hier ligt een cruciaal verschil tussen de KIQT+ en traditionele intelligentietests. Bij gangbare tests zoals de WISC-V neemt de meetprecisie sterk af naarmate scores hoger worden.

Er zijn een aantal factoren waardoor traditionele testen minder betrouwbaar zijn bij hogere scores:

Meetbereik
Soms is het absolute meetbereik van een test niet voldoende. Om een aantal voorbeelden te noemen:
- Op de WPPSI-IV (een test voor kinderen van 2 jaar en 6 maanden tot en met 6 jaar en 11 maanden) is het vanaf 5 jaar en 9 maanden op de subtest Figuur Leggen niet meer mogelijk om de maximale geschaalde score van 19 te behalen, er zijn simpelweg niet voldoende moeilijke items. Hetzelfde geldt voor de subtest Blokpatronen, ook hier zijn voor deze leeftijdscategorie simpelweg niet voldoende moeilijke items. Dit samen maakt dat voor deze leeftijdscategorie de maximale score op de Visueel Ruimtelijke Index (VRI) niet 155 maar slechts 138 is.
- Een ander voorbeeld betreft de WISC-V, een intelligentietest voor kinderen van 6 jaar en 0 maanden tot en met 16 jaar en 11 maanden. Bij deze test is het vanaf 8 jaar en 0 maanden niet meer mogelijk om de maximale geschaalde score (19) voor blokpatronen te behalen zonder tijdsbonussen te behalen. Een kind tussen de 8 jaar en 0 maanden en 16 jaar en 11 maanden dat dus alle opgaven goed en binnen de tijdslimiet beantwoordt, maar dat niet supersnel doet (bijvoorbeeld omdat hij de blokjes heel netjes recht wil leggen), zal dus niet de maximale score krijgen.
- Een derde voorbeeld is de WAIS-IV, een intelligentietest voor jongeren en volwassenen van 16 tot 85 jaar. Bij de leeftijdsband 30-35 kan op 8 van de 15 subtesten de maximale geschaalde score van 19 niet gehaald worden. Er zijn simpelweg niet voldoende moeilijke items.
Betrouwbaarheid in de extremen
Dat testen aan de extremen (de boven en onderkant) minder betrouwbaar zijn is een bekend fenomeen [Lohman et al, 2012]. Dit kan oplopen tot wel 2 tot 4 keer de meetfout zoals deze bij het gemiddelde is. Bij een test met een betrouwbaarheid (rond het gemiddelde) van 0.95, zoals bijvoorbeeld de WISC-V, is de meetfout van het totaal IQ volgens de handleiding 3.26 IQ punten. Maar als de meetfout in de extremen 2 tot 4 keer hoger is, dan stijgt de meetfout dus naar 3.26*2 = 6.52 (een betrouwbaarheid van 0.81) tot 3.26*4 = 13.04 (een betrouwbaarheid van 0.24). Rekening houdende met dat de COTAN een grens van 0.90 aanhoudt voor de beoordeling ‘Goed’ voor de betrouwbaarheid met betrekking tot belangrijke individuele beslissingen valt op dat deze grens in de extremen van een traditionele test dus niet meer wordt gehaald.
Normfout
Naast het bovengenoemde komt nog dat de normen van een test in de extremen nu eenmaal minder betrouwbaar zijn, omdat er simpelweg minder proefpersonen zijn om die normen op te baseren. Bij een klassieke normering met een aselecte normgroep van 1500 kinderen zitten, volgens verwachting, slechts 37 kinderen die een score van 130 of hoger behalen. Dat vertaalt zich ook wiskundig gezien in een minder precieze norm bij de extremen van een test. Deze zogenoemde normfout bedraagt ongeveer 3 IQ punten rondom het gemiddelde (100). Bij een IQ-score van 130 is deze normfout al 5 IQ punten, en bij een IQ van 160 is de normfout maarliefst 9 IQ punten. Eigenlijk zou deze normfout bij het betrouwbaarheidsinterval opgeteld moeten worden om te reflecteren dat de normen nu eenmaal minder betrouwbaar zijn bij een traditionele test.

Deze 3 factoren samengenomen (de beperkingen in het meetbereik, de verminderde betrouwbaarheid in de extremen, en de verhoogde normfout in de extremen) leidt tot drastisch grotere betrouwbaarheidsintervallen. Neem bijvoorbeeld een kind dat een score van 130 behaalt op een traditionele test met een betrouwbaarheid van 0.95 rond het gemiddelde. Volgens de handleiding van de test zou het bijbehorende betrouwbaarheidsinterval 122-135 moeten zijn. Als we echter aannemen dat de meetfout hier 2x groter is (zie punt 2), dan loopt dit betrouwbaarheidsinterval op naar 111-137. Als we dan ook nog de normfout meenemen (zie punt 3), loopt het betrouwbaarheidsinterval zelfs op tot 108-138.

De KIQT+ daarentegen is specifiek genormeerd en ontworpen voor het bereik 105-170+. Dat betekent: meer moeilijke items, preciezere normering in dit gebied, en een standaardmeetfout die consistent laag blijft – ook bij zeer hoge scores. Waar een traditionele test juist bij de kinderen die het meest een nauwkeurige diagnostiek nodig hebben, het minst betrouwbaar meet, blijft de KIQT+ consistent nauwkeurig. In de onderstaande afbeelding is de betrouwbaarheid van de KIQT+ voor verschillende leeftijden en Totaal IQ scores weergegeven.

Betrouwbaarheid KIQT per leeftijd en TIQ

Bij die praktijk komen alleen maar hoogbegaafde kinderen vandaan – debunked!

“Daar zijn ze alleen maar hoogbegaafd hoor”, horen we weleens van scholen. En we begrijpen de zorg. Als een school merkt dat kinderen die bij bepaalde praktijken zijn getest systematisch hoog scoren, rijst de vraag: klopt dat wel?

Het antwoord ligt in selectie-effecten, niet in systeemstoornissen.

Denk na over hoe diagnostiek werkt: ouders gaan niet zomaar naar een praktijk voor een IQ-test. Ze gaan omdat ze een vermoeden hebben. Een kind dat makkelijk leert, complexe vragen stelt, zich verveelt op school, of slechte resultaten haalt terwijl het wel slim lijkt.

Praktijken die met de KIQT+ werken, worden vaak specifiek gezocht door ouders die vermoeden dat hun kind hoogbegaafd is. Waarom? Omdat de KIQT+ bekend staat als een test die hoogbegaafdheid betrouwbaar kan vaststellen, en omdat praktijken die werken met de KIQT+ meestal ook veel ervaring hebben met het testen van vermoedelijk hoogbegaafde kinderen, en veel kennis in huis hebben om handvatten te kunnen bieden voor opvoeding en onderwijs aan hoogbegaafde kinderen. Dit creëert een selectie-effect: naar deze praktijken komen relatief meer kinderen die daadwerkelijk hoogbegaafd blijken te zijn.

Vergelijk het met een cardioloog: als 80% van de patiënten bij een cardioloog een hartprobleem blijkt te hebben, betekent dat niet dat de cardioloog iedereen ziek verklaart. Het betekent dat mensen met hartklachten meestal terecht naar een cardioloog verwezen worden, en dat de diagnostiek de vermoedens vaak bevestigt.

Datzelfde geldt hier. Bij praktijken die geen gespecialiseerde HB-diagnostiek doen, zie je een veel breder spectrum aan kinderen. Bij praktijken die met de KIQT+ werken en zich profileren op hoogbegaafdheid, ontstaat er een natuurlijke concentratie van hoogbegaafde kinderen in de praktijk.

Wat zien we in onze data?

Bij de bijna 170 praktijken/instellingen die met de KIQT+ werken, zien we geen patronen van fraude of systematisch verhoogde scores. We zien wel variatie in het percentage hoogbegaafde kinderen per praktijk – logisch, want sommige praktijken specialiseren zich meer in HB-diagnostiek dan anderen. Maar die variatie volgt een normaal patroon dat past bij de vraag die de praktijk krijgt, niet bij manipulatie van scores.

Ook zien we dat niet alle kinderen die de KIQT+ maken, een hoogbegaafde score behalen: In dit kalenderjaar (2025) behaalde minder dan 1 op de 3 kinderen die de KIQT+ maakten een score van 130 of hoger.

Voor scholen: als jullie merken dat kinderen van bepaalde praktijken vaak hoogbegaafd blijken, kijk dan naar de vraag waarom ouders naar die praktijk gingen. Meestal is het antwoord: omdat ze dat al verwachtten, en omdat die praktijk daar expertise in heeft. Ouders die onderzoek laten doen en een lagere score terugkrijgen, zullen daarnaast ook minder snel met dit rapport bij school aankloppen: Je ziet als school dus vooral die 1 op de 3 kinderen met een 130+ score, niet de 2 op de 3 waarvan de score daaronder blijft.

De 130-Paradox

We moeten eerlijk zijn over de context. De grens van IQ 130 voor hoogbegaafdheid is in het Nederlandse onderwijs vaak een harde drempel. Zit je op 129? Geen plusgroep of voltijds HB-school. Op 131? Dan gaan de deuren voor je open.

Deze zwart-wit grens creëert druk. Op ouders die het beste voor hun kind willen. Op scholen die met wachtlijsten kampen. En ja, ook op professionals die kinderen willen helpen en in een grijs gebied belanden.

We pleiten niet voor de manipulatie – absoluut niet. Maar we snappen de context waarin het gebeurt. De oplossing ligt niet in het verbergen van incidenten, maar in het transparant maken van processen én in het verder ontwikkelen van onderwijsbeleid dat minder leunt op harde IQ-grenzen en meer kijkt naar het totale beeld van een kind.

Samenvattend

Bij SCALIQ bouwen we instrumenten die psychologen, orthopedagogen, scholen en andere professionals helpen bij het in kaart brengen van de mogelijkheden van kinderen. Dat is een verantwoordelijkheid die we serieus nemen.

Daarom investeren we in:

Wetenschappelijke grondigheid in de ontwikkeling en validatie van onze instrumenten
Transparante communicatie over zowel successen als uitdagingen
Continue verbetering van onze kwaliteitsbewaking

De KIQT+ is niet perfect omdat er nooit iets mis kan gaan. De KIQT+ is betrouwbaar omdat wanneer er iets mis gaat, we het detecteren en aanpakken.

De tuchtrechtelijke zaak bij NVO zoals hierboven toegelicht, toont aan dat de KIQT+ omringd is door systemen die werken. Dat professionals die integer werken – bijna iedereen! – kunnen vertrouwen op een instrument dat doet wat het belooft. En dat kinderen recht hebben op objectieve, betrouwbare diagnostiek.

Want daar gaat het uiteindelijk om: elk kind verdient een eerlijke meting van zijn of haar potentieel als input voor begeleiding en leren op diens eigen manier en niveau. Geen aangepaste scores. Geen manipulatie. Geen compromissen. Alleen de waarheid, hoe complex die soms ook is.

Vragen over de KIQT+ of onze kwaliteitsbewaking? Neem contact op via info@scaliq.com

Voor meer informatie over de wetenschappelijke onderbouwing van de KIQT+, bekijk onze whitepaper.

Lohman, David F., Megan Foley Nicpon, and Scott L. Hunsaker. 2012. “CHAPTER 12 ABILITY TESTING AND TALENT IDENTIFICATION.” in Identification of students for gifted and talented services: Theory into practice. Prufrock PR.

Quote by Susan Jackson: We can't measure a three-foot organism with a one-foot ruler.

Vertrouwen in cijfers:Hoe betrouwbaar de KIQT+ is en hoe we dat monitorenOver integriteit en betrouwbaarheid van de KIQT+