Trekken Steekproef Ondernemingen (SO)
Publicatiedatum 04-09-2025
Op deze pagina vindt u informatie over het algoritme ‘Steekproef Ondernemingen’. Dit algoritme bakent de onderzoekspopulatie MKB af en selecteert hieruit aselect 3.600 entiteiten die in aanmerking komen voor een boekenonderzoek door middel van een gestratificeerde steekproef.
Situatie, doel en algemene omschrijving
• Het primaire doel van dit werkproces is de inzet van het instrument steekproeven om inzicht te verkrijgen in de juistheid en volledigheid van aangiften. En dat op statistisch verantwoorde wijze. De uitkomst van dit werkproces vormt mede de input voor de processen die leiden tot het jaarplan van de Belastingdienst en de jaarplannen van de Uitvoeringsdirecties. De steekproef ondernemingen geeft uitvoering aan het Beleidskader Steekproeven en wordt tweejaarlijks uitgevoerd.
De reden voor het gebruik van een algoritme in SAS Enterprise Guide (in plaats van handmatig) zijn:
- Efficiëntie: Voor de afbakening van de populatie worden grote datasets verwerkt.
- Nauwkeurigheid: Het algoritme voorkomt menselijke fouten bij het selecteren van eenheden.
- Reproduceerbaarheid: De steekproef kan exact worden herhaald met dezelfde instellingen.
- Transparantie: De gebruikte methode is duidelijk gedocumenteerd en controleerbaar.
• Dit algoritme bakent de onderzoekspopulatie MKB af en trekt hieruit een aselecte gestratificeerde steekproef van 3600 entiteiten. Deze entiteiten krijgen allemaal een boekenonderzoek. De controle-opdracht is voor alle entiteiten is hetzelfde.
• Het doel van het algoritme is het willekeurig en zonder specifieke aanleiding selecteren van 3600 entiteiten uit de MKB-populatie voor een boekenonderzoek.
Voordelen gebruik algoritme
De steekproef is belangrijk om het jaarplan van de Belastingdienst te kunnen bepalen. Het algoritme maakt het uitvoeren van de steekproef mogelijk. Het algoritme bepaalt systematisch en nauwkeurig de onderzoekspopulatie. De selectie die het algoritme maakt is gedocumenteerd en controleerbaar.
Het alternatief is dat een medewerker handmatig de onderzoekspopulatie bepaalt en aselect entiteiten selecteert. Hiervoor zouden alle entiteiten bekeken moeten worden. Dit is niet efficiënt en foutgevoelig.
Gegevens, gegevensverwerking en controle
De volgende gegevens worden ingevoerd in het algoritme:
Gebruikte gegevens | Bron |
Persoons- en entiteitgegevens belastingplichtige | Basisregistratie Personen (BRP), Belastingdienst |
Aangiftegegevens IH voor bepalen belastingplicht IH en indicatie winstaangifte | Belastingdienst |
Omzetgegevens voor bepalen belastingplicht OB en fiscaal belang OB | Belastingdienst |
Loongegevens voor bepalen belastingplicht LH en fiscaal belang LH | UWV |
Resultaten boekenonderzoeken | Belastingdienst |
Indicatie HT | Belastingdienst |
Indicatie ANBI | Data.overheid.nl |
Wettelijke basis
De gegevens in bovenstaande tabel worden voor het doel van de algoritme verwerkt om de volgende wetten uit te voeren:
- Algemene wet inzake rijksbelastingen
- Algemene wet bestuursrecht
- Algemene verordening gegevensbescherming
- Uitvoeringswet algemene verordening gegevensbescherming
- Wet op de Loonbelasting 1964
- Wet Inkomstenbelasting 2001
- Wet op de Omzetbelasting 1968
- Wet algemene bepalingen burgerservicenummer
- Archiefwet 1995
Type algoritme
Het algoritme bestaat uit selectieregels die inhoudsdeskundigen hebben opgesteld op basis van expertise. Hiermee wordt de onderzoekspopulatie MKB vastgesteld. Hieruit worden willekeurig en zonder specifieke aanleiding 3600 entiteiten geselecteerd die in aanmerking komen voor een boekenonderzoek door middel van een gestratificeerde steekproef.
De onderzoekspopulatie gaat om alle MKB-entiteiten met relevante belastingplicht (combinatie van IH/VPB/OB,LH) en een actieve onderneming. De MKB-populatie is scheef verdeeld. De MKB-populatie varieert van kleine 1-persoons-ondernemingen tot grote werkgevers (tot 500 werknemers). De groep kleine 1-persoons-ondernemingen is veruit het grootst. Om te waarborgen dat in de steekproef voldoende diversiteit aan ondernemingen aanwezig is, wordt de steekproef gestratificeerd getrokken. Op basis van leeftijd van de entiteit, werkgeverschap, hoogte omzet, hoogte fiscaal belang LH en VPB-belastingplicht wordt een verdeling gemaakt in 7 strata. Binnen elk stratum wordt een aselecte steekproef getrokken. De geselecteerde entiteiten krijgen allemaal een boekenonderzoek. De controle-opdracht voor al deze entiteiten is hetzelfde.
Het algoritme is niet zelflerend. Dat betekent dat het algoritme zichzelf niet ontwikkelt tijdens het gebruik ervan.
Controle
Het algoritme is door medewerkers van de Belastingdienst ontwikkeld en wordt ook intern onderhouden.
Privacy en AVG
Het gebruik van de gegevens dient te worden getoetst aan de Algemene Verordening Gegevensbescherming (AVG). Door het toetsen van persoonsgegevens komen eventuele privacyrisico's in beeld en kunnen passende maatregelen genomen worden.
De AVG schrijft voor dat er niet meer gegevens gebruikt mogen worden dan noodzakelijk is. Dat heet dataminimalisatie. De Belastingdienst onderzoekt regelmatig of de gebruikte gegevens nog nodig zijn en dus gebruikt mogen worden.
Gebruik bijzondere persoonsgegevens
Er worden in dit algoritme geen bijzondere persoonsgegevens verwerkt.
Gelijkheid en non-discriminatie
Het algoritme wordt beoordeeld in lijn met toepasselijke non-discriminatiebeginselen voor directe en indirecte discriminatie. Door zo min mogelijk persoonsgegevens te verwerken, wordt het risico op directe discriminatie verkleind. Medewerkers die betrokken zijn bij de ontwikkeling en het beheer van de algoritmen krijgen training over gegevensbescherming en vooroordelen.
Waarborgen
De Algemene wet bestuursrecht (Awb) vereist dat het handelen van de overheid transparant en rechtmatig is. De Belastingdienst neemt bij de toepassing en ontwikkeling van algoritmen de algemene beginselen van behoorlijk bestuur in acht.
In het algoritme worden gegevens gebruikt die zijn verzameld in het kader van verschillende belastingwetten. Zoals de AVG voorschrijft worden er niet meer gegevens gebruikt dan noodzakelijk is.
Menselijke tussenkomst
Menselijke tussenkomst in de context van de Belastingdienst houdt in dat een bevoegde en deskundige medewerker een wezenlijke rol speelt in de besluitvorming. Combinatie van menselijke tussenkomst en beslissingen door het algoritme.
Bij de werking van het algoritme is sprake van menselijke tussenkomst, maar er worden ook beslissingen genomen door het algoritme. Het deel van het algoritme dat de MKB-populatie afbakent, wordt gecontroleerd gedraaid. Dat wil zeggen dat bij elke stap wordt gecontroleerd of de uitkomst aan de verwachting voldoet.
De uiteindelijke uitvoering is het aselect trekken van een steekproef deze wordt uitgevoerd door het algoritme. Bij het opvoeren van de controleopdrachten na de steekproef in het systeem, wordt door een medewerker nog allerlei handmatige checks in de relevante systemen gedaan. Deze medewerker maakt uiteindelijk de keuze of het boekenonderzoek uitgevoerd kan worden.
Vragen over het Algoritmeregister?
Wilt u contact met ons over het algoritmeregister? Stuur dan een e-mail naar algoritmeregister@belastingdienst.nl. Bent u journalist? En heeft u vragen na het lezen van deze informatie? Neem dan contact op met een van de persvoorlichters van de Belastingdienst.