Ga direct naar de inhoud Ga direct naar de footer

Op deze pagina

Informatie-extractie uit, en classificatie van, notariële akten (DNI)

Op deze pagina vindt u informatie over het algoritme 'Informatie-extractie uit, en classificatie van, notariële akten (DNI)'. Dit algoritme helpt medewerkers van de Belastingdienst bij het toezicht houden op de registratie van notariële akten.  

Situatie, doel en algemene omschrijving

De Belastingdienst gebruikt informatie uit notariële akten met als doel toezicht te houden op de registratie van notariële akten, daarnaast worden de gegevens gebruikt voor het heffen en innen van belastingen. Het gaat om grote aantallen akten en daarom halen we de informatie voor een groot deel geautomatiseerd uit de akte. Hiervoor worden 2 algoritmen gebruikt.

  1. Algoritme 1 bepaalt wat voor soort akte er is binnengekomen,
  2. Algoritme 2 haalt relevante informatie uit de akte.

Deze informatie is daarna beschikbaar voor de afdelingen die de informatie nodig hebben voor het uitvoeren van hun werk, namelijk: De Koninklijke Notariële Beroepsorganisatie (KNB) en de notaris zelf ten behoeve van het toezicht op de juiste registratie van de notariële akte en de Belastingdienst directies: Particulieren, MKB en Grote ondernemingen ten behoeve van het heffen en innen van belastingen.

Zowel algoritme 1 als algoritme 2 zijn ter ondersteuning aan het overkoepelde proces van ‘Digitalisering van Notariële Informatie’.

Voordelen gebruik algoritmes

Het gaat om grote aantallen akten en daarom halen we de informatie voor een groot deel geautomatiseerd uit de akte met behulp van het algoritme.

Door het gebruik van het algoritme zijn er minder mensen nodig om de informatie handmatig in de akten te zoeken en komt de informatie uit een akte sneller digitaal beschikbaar. Akten kunnen daardoor sneller verwerkt worden. Daarnaast zorgt het gebruik van het algoritme er voor dat de akte op de juiste plaats binnen de organisatie beschikbaar is.

Gegevens, gegevensverwerking en controle

Gebruikte gegevensBron
PDF van notariële aktenAangeleverd door notaris
Naam
Adres en woonplaats
Geboortedatum en geboorteplaats
KvK-nummer
Bijzondere persoonsgegevens*
PDF van notariële akten

*De Belastingdienst ontvangt op grond van art. 7a en 7b Registratiewet 1970 een volledige kopie van notariële akten en slaat deze op. Inherent hieraan is dat gegevens die als bijzondere persoonsgegevens aangemerkt kunnen worden, uit de tekst van de akten gedestilleerd kunnen worden, zoals bestuurders van organisaties waaruit een politieke voorkeur is te herleiden, etnische afkomst of religieuze opvatting. De bijzondere persoonsgegevens zijn integraal onderdeel van het ontvangen en opslaan van akten, maar spelen bij de verdere verwerking geen rol.

Wettelijk kader

Uitgewerkt en nader toegelicht in het document: Data Protection Impact Assessment (DPIA) Notariële Akten Belastingdienst.

Het verzamelen en het gebruik van de hierboven beschreven gegevens is geregeld in de:

Type en werking algoritme

Algoritme 1 (zoals hierboven beschreven) maakt gebruik van “machine learning”. Het algoritme wordt aan de hand van voorbeeldakten getraind om teksten in de akte, die relevante informatie bevatten, te kunnen herkennen. Het algoritme is niet zelflerend, dat zou betekenen dat het zich ontwikkelt tijdens het gebruik ervan. Dat is niet het geval.

 Algoritme 2 is op regels gebaseerd.

Werking algoritmen op hoofdlijnen:

  • Algoritme 1 probeert de juiste aktesoort vast te stellen die overeenkomt met de inhoud van de akte. Denk bij aktesoort bijvoorbeeld aan een testament of een koopakte voor een woning.
  • Afhankelijk van de aktesoort wordt er door algoritme 2 gezocht naar specifieke informatie in de akte en wordt de gevonden informatie digitaal beschikbaar gemaakt. Algoritme 2 omvat een reeks aan regels die informatie uit akten haalt, bijvoorbeeld namen, adressen en geboortedata. Voor specifieke aktesoorten worden ook rollen uit de akte gehaald (wie is de koper, erflater, notaris etc.). Afhankelijk van het soort akte worden er tussen de 10 en 180 informatie-elementen uitgehaald.

Als er geen aktesoort vastgesteld kan worden, of als andere van belang zijnde gegevens in de akte ontbreken wordt, indien handmatig onderzoek door de Belastingdienst geen oplossing biedt, er contact gezocht met de notaris om de ontbrekende gegevens aan te vullen of te corrigeren.

Controle

Het algoritme is bij de Belastingdienst zelf ontwikkeld en wordt ook intern onderhouden. Volgens afspraak controleren het team dat het algoritme heeft ontwikkeld en het team dat functioneel beheer uitvoert regelmatig of de uitkomsten van voldoende kwaliteit zijn.

Gelijkheid, non-discriminatie en privacy

Het gebruik van de gegevens is getoetst aan de Algemene Verordening Gegevensbescherming (AVG) middels een Data Protection Impact analyse. De Belastingdienst voorkomt directe discriminatie met algoritmes. Bijzondere persoonsgegevens, zoals etnische afkomst, spelen geen rol.

Waarborgen

Beide algoritmes zijn ontwikkeld in overeenstemming met het kwaliteitsframework van de Belastingdienst. Hierin staan regels en afspraken die zijn gevolgd bij de ontwikkeling van het algoritme. De voorwaarden van de Auditdienst Rijk zijn hierbij leidend. Op vaste momenten controleert de Belastingdienst of het algoritme nog steeds aan de kwaliteitseisen voldoet.

Gebruik beschermde of gevoelige variabelen

Het betreft een tekstherkenning algoritme, variabelen zoals hier wordt bedoeld zijn niet aan de orde.

Vragen over het Algoritmeregister?

Wilt u contact met ons over het algoritmeregister? Stuur dan een e-mail naar algoritmeregister@belastingdienst.nl. Bent u journalist? En heeft u vragen na het lezen van deze informatie? Neem dan contact op met een van de persvoorlichters van de Belastingdienst.

Deel deze pagina