Arjan Brouwer

Een correlatie betekent niet per definitie dat sprake is van een causale relatie, benadrukt Arjan Brouwer.

Discussie Column

Ooievaarstatistiek of struisvogelpolitiek?

Tijdens het college over hedge accounting besteed ik vaak aandacht aan ooievaars. Waarom? Om hedge accounting toe te passen moet een onderneming aan een aantal voorwaarden voldoen. Eén van de vereisten is dat ze aantoont dat er een economische relatie bestaat tussen het hedged item en het hedging instrument (bijvoorbeeld een derivaat). Terecht wordt daarover in IFRS 9 benadrukt dat louter het bestaan ​​van een statistische correlatie tussen twee variabelen, op zichzelf nog onvoldoende basis is voor een conclusie dat de vereiste economische relatie bestaat.

Dat leidt soms tot vragende ogen in de collegezaal. Hoezo zou de economische relatie tussen het derivaat en de onderliggende positie niet aanwezig zijn als er een statistische correlatie bestaat tussen de twee? De uitleg dat correlatie niet meer en niet minder betekent dan dat twee variabelen een bepaalde samenhang vertonen of vertoond hebben, en dat dat iets anders is dan causaliteit, een oorzaak-gevolg relatie, overtuigt lang niet iedereen.

En dan is het tijd om het verhaal over de ooievaar, of meer specifiek 'ooievaarstatistiek', te vertellen. Onderzoekers hebben over een langere periode het verband onderzocht tussen het aantal ooievaars en het aantal geboortes. Wat bleek? Ze vonden een behoorlijk sterk verband tussen deze twee variabelen. De afname van het aantal geboortes hield gelijke tred met de afname van het aantal ooievaars. Replicatie van dit onderzoek over andere tijdvakken en in andere geografische gebieden leverde hetzelfde beeld op. En daarmee was dus statistisch aangetoond dat ooievaars de baby's bezorgen. Geloof het of niet, de feiten en statistiek spreken voor zichzelf.

Zo bestaat er ook een statistisch significant verband tussen het aantal verkochte ijsjes en het aantal verdrinkingen. Zou je van ijs eten slechter gaan zwemmen? Hoeveel ijsjes moet je dan eten? En wist je overigens dat het behoorlijk gevaarlijk is om naar bed te gaan? Het schijnt namelijk dat de kans dat je in bed sterft erg groot is.

Het is nu ongetwijfeld duidelijk dat correlatie iets anders is dan causaliteit. Sommige verbanden berusten op toeval, in andere gevallen is er een derde of vierde factor in het spel die beide variabelen beïnvloedt. Als er een relatie wordt gevonden tussen twee variabelen, is het daarom van belang nader te onderzoeken wat die relatie verklaart. Naarmate het gemakkelijker en goedkoper wordt om grote datasets te analyseren en verbanden te identificeren wordt dit nog belangrijker. Het wordt hierdoor namelijk steeds minder noodzakelijk voor onderzoekers om vooraf goed na te denken over de te verwachten verbanden en te verzamelen data.

Nieuwe technologieën maken het soms ook moeilijker om te begrijpen welke factoren precies leiden tot een onderzoeksuitkomst. Wu & Zhang publiceerden in 2016 een onderzoek waarin ze claimen dat ze met behulp van machine learning in staat waren om, op basis van profielfoto's, criminelen te onderscheiden van niet-criminelen. Het is niet helemaal duidelijk wat de resultaten heeft veroorzaakt, maar het lijkt erop dat niet-criminelen over het algemeen vrolijker op de voor de training gebruikte foto's stonden dan criminelen. Heb je dan een crimineeldetector ontwikkeld, of een glimlachdetector?

Hoe kom ik op dit onderwerp? Eerder dit jaar bracht de AFM een rapport uit waarin ze verslag doet van onderzoek naar de relatie tussen bepaalde kenmerken van accountantsorganisaties en de uitkomsten van kwaliteitstoetsingen. Van de vijftig kenmerken ging bij drie kenmerken een lampje branden en de resultaten suggereren een relatie tussen omvang van de accountantsorganisatie en kwaliteit. Het leidde tot geprikkelde reacties en kritiek op de onderzoeksmethodiek.

Ook hier geldt dat de correlatie niet per definitie betekent dat sprake is van een causale relatie; iets dat de AFM zelf op pagina 26 van het rapport ook benoemt. Dat betekent dat aan het verband niet zonder meer conclusies over te nemen acties verbonden kunnen worden. Het is wel zinvol om te onderzoeken wat de verschillen veroorzaakt. Net zoals het zinvol is om te onderzoeken waarom bepaalde kantoren, van vergelijkbare omvang, in de toetsingen positiever worden beoordeeld dan andere kantoren.

Data-analyse kan een eerste richting geven voor verdiepend, kwalitatief, onderzoek. Maar het is juist die diepgaande oorzakenanalyse die kan helpen om dieperliggende factoren te identificeren, die kantoren kunnen beïnvloeden voor het waarborgen van kwaliteit. Laten we daar vooral de energie in stoppen. Want het is goed om te waken voor ooievaarstatistiek, maar dat geldt ook voor struisvogelpolitiek.

Wat vindt u van deze column?

Reageer

Arjan Brouwer is partner bij PwC en hoogleraar externe verslaggeving aan de VU Amsterdam.

6 reacties

jules muis

@Arjan,

Bij lezing van dit verhaal bekroop me het gevoel dat er iets meer
te halen valt uit het interessant naast of tegenover elkaar zetten van twee optisch verwant ogende vogels.
Maar qua fysieke prestatie en mindset oh zo’n verschillende beesten: hoogvlieger, laagvlieger, balerina, sprinter, elegantie, ontwijkgedrag, en een wezenlijk ander gedachten over de kinderzorg.

Dus je gaat te rade bij de digitale Volks Universteit, Prof, Dr. Google.

Als je ‘ de struisvogel en de ooievaar‘ invoert loop je tegen een interessante vergelijking aan.

Een bijdrage uit de ‘Watchtower’ nog wel ( ik neem aan ‘ de Wachttoren’ die we nog kennen van het Leger des Heils) en die de twee dieren bespreekt vanuit een Bijbels perspectief ( graaft dus net wat dieper en verder dan een AFM rapport). Met vooral Job citaten!

( Er is ook een boek uit 1888, van van Gennep en de Gauw, een juweeltje, over gevelstenen waarop de een en de ander nog wel eens figureert).

Ik ben nog bezig te zien of er correlatieve of causale verbanden uit te halen zijn. Meestal komt het uit op een vermoeden van beiden, en dat maakt het kwetsbaar voor manipulatie en wetenschappelijke intimidatie. Met altijd de kip of het ei conundrum als intellectueel hoogtepunt.

Zijn we toch weer terug bij vogels.

Jan Sinke

Heuristiek als anchoring bias speelt hier ook een rol. Om in termen van het gevogelte te blijven: we moeten op zoek naar het zwarte zwaantje en het lijkt vaak dat de focus is om vast te stellen dat we voldoende witte zwanen hebben gezien en daarmee het 'risico op zwarte zwanen' aanvaardbaar laag is.

Endymion Struijs

Dank je wel, @Arjan, voor deze bijdrage!

Over ooievaarstatistiek en struisvogelpolitiek gesproken... en, on a personal note, het belang van de alfa (geesteswetenschappelijke) kant (incl. "ECG" Ethiek Cultuur Gedrag) ten opzichte van beta (natuurwetenschappelijke) kant van de gamma balans!

R.J.A.M. Vromans

Wat een helder geschreven stuk voor allerlei pluimage, complimenten.

Jan Bouwens

Zonder goede theorie is elk empirisch onderzoek bevattelijk voor Ooievaarsstatistiek. Pas dus op met data mining en met ja inderdaad ook met process mining.

Frans Kersten

Helaas leiden ook de harde uitkomsten van data-analyse vaak tot struisvogelpolitiek, met name in de politiek zelf, omdat de uitkomsten dan om welke reden ook niet passend of bruikbaar worden geacht.

Reageren op een artikel kan tot drie maanden na plaatsing. Reageren op dit artikel is daarom niet meer mogelijk.

Aanmelden nieuwsbrief

Ontvang elke werkdag (maandag t/m vrijdag) de laatste nieuwsberichten, opinies en artikelen in uw mailbox.

Bent u NBA-lid? Dan kunt u zich ook aanmelden via uw ledenprofiel op MijnNBA.nl.