Statistical auditing (89) 24 februari 2021

De Janboerenfluitjes-methode

Leestijd van ongeveer 8 minuten 0 reacties

Accountant, bent u ook zo enthousiast over de JBF-methode om steekproeven te evalueren? Ik niet.

De AICPA Audit Sampling Guide (tabel 5.1, pagina 94 van de 2020 editie) geeft een voorbeeld van een evaluatie van een niet-statistische steekproef. Dit blijkt de methode te zijn die accountants kennen als 'de janboerenfluitjesmethode'. In de voetnoot onderaan die bladzijde wordt verwezen naar een betere methode die uitgaat van een statistische steekproef. Ik zal laten zien waarom deze JBF-methode niet deugt en hoe de betere methode, die uit de voetnoot in de Guide, werkt.

Een voorbeeld:

Uit een populatie van 10.000 transacties die samen een bedrag van 1.000.000 euro vertegenwoordigen, wordt een (aselecte) steekproef van 3 waarnemingen gedaan. Voor de JBF-methode maakt het niet uit of er transacties (postensteekproeven) of euro’s (geldsteekproeven) zijn gestoken. De gegevens zijn:

Waarneming	Geboekt in €	Correct in €	Fout in €
1	50	43	7
2	100	95	5
3	150	150	0
	300	288	12

De JBF-methode stelt nu dat van de 300 gecontroleerde euro’s er 12 fout zijn, en dat daarom dus ook 4% van de populatie van 1.000.000 euro, dus 40.000 euro fout is.

Wat is er tegen? Straks zal ik vanuit de wiskunde aangeven hoe het wel moet, en dan vergelijk ik de wiskundig juiste formule met de formule die hier wordt gehanteerd. Maar eerst, waarom deze aanpak niet kan kloppen:

De JBF-methode gaat er in dit voorbeeld vanuit dat er 300 waarnemingen zijn gecontroleerd (waarvan er 12 fout zijn). Dat is niet zo: bij een postensteekproef zijn er 3 van de 10.000 transacties geselecteerd en bij een geldsteekproef zijn er 3 van de 1.000.000 euro’s gestoken en er kwamen 297 euro’s onvrijwillig mee. Door de gecontroleerde euro’s te tellen baseert de JBF-methode in dit voorbeeld de conclusie voor 50% op waarneming 3 (zie tabel hierna)!
Dat in een geldsteekproef van 3 meer dan 3 euro’s zijn gecontroleerd geeft inderdaad meer zekerheid. Het effect daarvan zit niet in de geprojecteerde fout (de meest waarschijnlijke uitkomst vergeleken met een integrale controle op basis van de bevindingen) maar in de maximale fout (een zo pessimistische raming van de uitkomst van een integrale controle dat het steekproefrisico tot een aanvaardbaar laag niveau is teruggebracht). Dat effect is overigens te verwaarlozen als de gecontroleerde transacties klein zijn ten opzichte van het bedrag dat door één gestoken euro wordt vertegenwoordigd (1.000.000/3 = 333.333).
Zowel de uitkomst 12 (de totale fout) als de uitkomst 300 (het totaal gecontroleerde bedrag) zijn door toeval tot stand gekomen steekproefresultaten. Als waarneming 3 geen 150 maar 200 euro (geboekt en correct) was geweest dan was de breuk veranderd.

Dat betekent dat deze JBF-methode - die in de Audit Sampling Guide van de AICPA "niet statistisch" wordt genoemd – neerkomt op een van de lastigste problemen in de statistiek: hoe om te gaan met de breuk tussen twee aan kans onderhevige resultaten?

Hoe dan wel?

Hoe moet het dan wel? Het idee van een foutprojectie is het gevonden foutbedrag te corrigeren voor de kans op ontdekken. Voor elk element van de steekproef is de bijdrage tot de foutprojectie gelijk aan het foutbedrag gedeeld door de kans op selectie. Omdat postensteekproeven en geldsteekproeven anders werken qua selectiekansen, moeten we ze apart behandelen.

Postensteekproef
Item 1 heeft een foutbedrag van 7. De kans op selectie van item 1 is bij een postensteekproef van 3 uit een populatieomvang van 10.000 posten: 3/10.000. Let op: de omvang van de transacties is bij een postensteekproef niet relevant. De bijdrage tot de foutprojectie is dus 7 gedeeld door 3/10.000.

Interessant: de juiste methode geeft dezelfde uitkomst als de onjuiste methode! Hoe kan dat? Nou, dat is omdat de gemiddelde omvang van de gestoken posten (300/3) gelijk is aan de gemiddelde omvang van alle posten (1.000.000/10.000). Bij een postensteekproef is dat naar verwachting het geval, maar zeker niet gegarandeerd. Iets wat gemiddeld klopt, klopt per toepassing zelden. Kijk maar wat er gebeurt als waarneming 3 een correct geboekt bedrag van 200 was geweest.

Waarneming	Geboekt in €	Correct in €	Fout in €	Selectiekans	Bijdrage tot projectie in €
1	50	43	>7	0,0003	23333,33333
2	100	95	5	0,0003	16666,66667
3	150	150	0	0,0003	0
	300	288	12		40.000

Geldsteekproef
Waarneming 1 heeft een foutbedrag van 7. De kans op selectie van waarneming 1 van 50 euro is bij een geldsteekproef van 3 uit een populatieomvang van 1.000.000 euro: 3 maal 50/1.000.000. De omvang van de transactie is nu dus wel relevant: hoe meer euro in een transactie, des te groter de kans op selectie. De bijdrage tot de foutprojectie is dus 7 gedeeld door 3 maal 50/1.000.000.

Waarneming	Geboekt in €	Correct in €	Fout in €	Selectiekans	Bijdrage tot projectie in €
1	50	43	7	0,00015	46666,66667
2	100	95	5	0,0003	16666,66667
3	150	150	0	0,00045	0
	300	288	12		63.333

Wat ik in getallen heb gedaan, kan ook in symbolen; de uitkomst verandert niet maar het geeft wel een altijd bruikbare formule. Postensteekproef in symbolen:
T posten hebben samen boekwaarde M en de steekproef bestaat uit n waarnemingen. Voor elke waarneming weten we de geboekte waarde x en de juiste waarde y, dus het foutbedrag (dat ook 0 kan zijn!) is x - y.

De kans op selectie van een transactie is bij een postensteekproef (n/T), dus gelijk voor elke waarneming. De bijdrage aan de geprojecteerde fout is gelijk aan foutbedrag gedeeld door selectiekans, dus (x - y) / (n/T) euro. Voor alle waarnemingen samen kun je dit schrijven als T * SOM((x - y) / n) oftewel:
Aantal posten maal gemiddeld foutbedrag per steekproefpost bij een postensteekproef.

In het voorbeeld: 10.000 maal (12/3) = 40.000.
Geldsteekproef in symbolen:
De totale boekwaarde van de T transacties is M. De kans op selectie van een transactie van omvang x is bij een geldsteekproef: x * n / M (de kans hangt nu immers af van de boekwaarde van de post ten opzichte van de totale boekwaarde).
Voor elke waarneming is de bijdrage aan de geprojecteerde fout nu: (x - y) / (x * n/M) euro. Voor alle waarnemingen samen kun je dit schrijven als (M/n) * SOM(x - y) / x.
We herkennen (M/n) als het selectie-interval voor de geldsteekproef, en SOM (x - y) / x als de totale foutfractie (ook wel taint genoemd).
De formule wordt dus:
Interval maal totale foutfractie bij een geldsteekproef.

In het voorbeeld: de foutfracties zijn 7/50 =0,14 en 5/100 =0,05 dus samen 0,19. Het interval is 1.000.000/3 = 333.333 dus de uitkomst wordt 333.333 maal 0,19 = 63.333

Conclusies

Bij een postensteekproef is het steekproefgemiddelde van de transacties (de noemer die niet gebruikt mocht worden) gemiddeld gelijk aan het populatiegemiddelde (de noemer die wel gehanteerd had moeten worden). De JBF-methode geeft dus een gemiddeld juiste, maar onzuivere schatting van de foutprojectie waarbij geen maximale fout is te bepalen en dus de onzuiverheid niet kan worden gekwantificeerd.

Bij een geldsteekproef is het ondenkbaar dat de gemiddelde steekproefwaarneming gelijk is aan de gemiddelde omvang van de transacties in de populatie. De steekproef is immers getrokken met kansen evenredig met de omvang van de transacties en de gemiddelde steekproefwaarneming is dus (veel) groter dan de gemiddelde transactie in de populatie.

Deze JBF-methode (evaluatie postensteekproef als was het een geldsteekproef) deelt dus door een te groot gemiddelde een geeft daarmee een onderschatting van de geprojecteerde fout.
Vandaar dat de voetnoot op bladzij 94 van de AICPA Audit Sampling Guide meldt dat als de niet-statistische steekproef is gemaakt om op een geldsteekproef te lijken (door transacties met hogere bedragen meer kans te geven dan kleinere bedragen), er beter met een andere formule kan worden gewerkt. Dat blijkt de formule die ik heb uitgelegd: foutbedrag gedeeld door selectiekans.

Voor de liefhebbers (en die blijken er inderdaad te zijn!): de wiskundige fout in de JBF-methode is dat men SOM((x-y)/x) heeft verward met SOM(x-y)/SOM(x). In het voorbeeld: 7/50+5/100+0/150 is niet hetzelfde als (7+5+0)/300. Bij een postensteekproef is SOM((x-y)/n) wel gelijk aan (1/n) SOM(x-y). In het voorbeeld: 7/3+5/3+0/3 = (7+5+0)/3. Dat is het hele verschil.

Reageer

Drs. Paul van Batenburg is zelfstandig adviseur die als statisticus met verstand van controleren de eenmanszaak en website steekproeven.eu voert.

Gerelateerd

Statistical auditing (106) 23 maart 2026

Voorraadcontroles: schatten van de werkelijke waarde met open-source software

Bij de controle van handels en productieondernemingen wordt vaak een fysieke voorraadcontrole uitgevoerd. Daarbij komen regelmatig afwijkingen aan het licht, bijvoorbeeld...

Statistical auditing (105) 10 december 2025

Auditen van de eerlijkheid van een algoritme, met behulp van statistiek

Eind 2024 trad de EU-wetgeving op kunstmatige intelligentie (AI) in werking. Deze wetgeving is opgesteld om het toenemende gebruik van AI in besluitvormings- en...

Statistical auditing (104) 05 september 2025

De Wet van Benford

De Wet van Benford kent toepassingen binnen de audit en is opgenomen in veel auditsoftwarepakketten. Een verkenning van mogelijkheden, beperkingen en toetsing met...

Nieuws 24 april 2025

Symposium over statistiek in ESG

Hoe ver is de auditpraktijk met het toepassen van data-analyse op het gebied van ESG? De Stuurgroep Statistical Auditing van het Limperg Instituut gaat daarop in,...

Statistical Auditing (103) 22 november 2024

Machine learning in de audit: stratificeren van bedrijfslocaties

In dit derde en laatste deel van een reeks columns over machine learning in de audit gaat het over clusteren. De auteurs laten zien hoe je met een open-source statistiekprogramma...