Data structuren en coderen

Aflevering 2

Van registratie naar bruikbare data

"Een goede dataset ontstaat niet vanzelf. Na vastleggen dienen data gestructureerd, volledig en volgens internationale standaarden gecodeerd, klaargemaakt te worden voor hergebruik." 


Otto Visser, hoofd Registratie bij IKNL

Voorbeeld fictieve patiënt Evert, 67 jaar
Diagnose: niet-kleincellig longcarcinoom (NSCLC), stadium IIIA
Zorgtraject: diagnostiek in ziekenhuis A, behandeling in ziekenhuis B

In aflevering 1 maakten we kennis met Evert, 67 jaar oud. Bij hem werd longkanker vastgesteld. De datamanager heeft alle belangrijke informatie over Everts diagnose en behandeling ingevoerd in de registratiesoftware RANK. Maar wat gebeurt er daarna?

Everts gegevens worden netjes gestructureerd en gecodeerd volgens internationale afspraken, zodat ze kunnen worden vergeleken met die van andere patiënten in Nederland en daarbuiten. Everts data worden klaargemaakt voor hergebruik, veilig, anoniem en niet herleidbaar. 

Toch blijft zijn verhaal bewaard - in de vorm van betrouwbare data die gebruikt kunnen worden voor onderzoek en het verbeteren van longkankerzorg. Evert draagt daarmee, zonder dat hij het misschien weet, bij aan betere zorg voor anderen. 


Geschikte data beginnen bij goede en betrouwbare registratie, zagen we in deel 1 van deze serie. Wanneer een patiënt de diagnose kanker krijgt, wordt dit zorgvuldig vastgelegd door de datamanager. In de Nederlandse Kankerregistratie (NKR) zijn gegevens vastgelegd vanaf de diagnose van kanker tot en met de afronding van de eerstelijnsbehandeling. Daarnaast wordt van alle patiënten het moment van overlijden bijgehouden. Voor steeds meer patiënten zijn er ook follow-up gegevens beschikbaar, dat wil zeggen gegevens over wat er is gebeurd tussen de afronding van de eerstelijnsbehandeling en het overlijden. 

Vastleggen van al deze informatie gebeurt in RANK — het landelijke registratiesysteem van de NKR. IKNL-experts met veel oncologische kennis hebben deze applicatie zelf ontwikkeld om kankerdata uit heel Nederland veilig, uniform en reproduceerbaar op te slaan en te beheren. Het systeem maakt het mogelijk om complexe medische informatie te structureren, te controleren en klaar te maken voor gebruik in onderzoek en statistiek. Per tumorsoort bevat RANK zowel vaste als tijdelijke itemsets: vooraf gedefinieerde velden die ingevuld moeten worden, afhankelijk van het type kanker. Bij longkanker zijn bijvoorbeeld diagnose, TNM, WHO-score en behandelingen vereist. RANK controleert direct of de velden juist en volledig zijn ingevuld en waarschuwt bij fouten. Denk aan waarschuwingen als “onjuist geslacht“ als er prostaatkanker bij een vrouw is geregistreerd, of een ontbrekend stadium waar dat wel geregistreerd had moeten worden. Zo helpt RANK niet alleen bij registratie, maar ook bij het voorkomen van fouten.

Data invoeren is één ding,” zegt Otto Visser, hoofd Nederlands Kankerregistratie bij IKNL. “Maar als je wilt dat onderzoekers, analisten of artsen er iets zinnigs mee kunnen doen, moet je zorgen dat de data geschikt zijn voor analyse. Dat betekent goede codering via internationaal erkende standaarden, en opslag via internationaal erkende datamodellen, metadata en een datacatalogus.” 

De coderingen in RANK is gebaseerd op internationale standaarden, zoals: 

  • de ICD-O (International Classification of Diseases for Oncology) voor tumortype, de lokalisatie en de weefselclassificatie;
  • de TNM-classificatie van de UICC voor het vastleggen van het stadium;
  • en richtlijnen van de ENCR en IACR voor uniforme, internationaal vergelijkbare registratie, bijvoorbeeld richtlijnen over wat je moet registreren als een patiënt meerdere tumoren heeft.

RANK zorgt ervoor dat gegevens vanuit alle ziekenhuizen in Nederland op dezelfde manier worden vastgelegd — en dus vergelijkbaar zijn over tijd, instellingen en zelfs landen heen. Nauwkeurig wordt vastgelegd wat precies wordt geregistreerd: welke itemsets per tumorsoort, maar ook vanaf welke datum of tot welke datum een bepaald gegeven is verzameld. Dit wordt voor iedereen ontsloten via de website van IKNL waarop de itemsets en de datacatalogus te vinden zijn. Dit maakt standaardisatie en integratie van gegevens mogelijk, waardoor de analyse van observationele gegevens efficiënter en betrouwbaarder wordt, zoals we in deel 3 van deze serie zullen zien Maar de registratie stopt daar niet. IKNL-experts voeren aanvullende kwaliteitscontroles uit op de geregistreerde data: op consistentie, uniformiteit en volledigheid. Bij twijfel of onduidelijkheid wordt overlegd met medisch inhoudelijke experts of de datamanager zelf.

 Zonder die kwaliteitscontroles zou niemand de data mogen gebruiken,” zegt Otto. “Juist door de kwaliteit van de data te bewaken maken we verantwoord gebruik mogelijk.” 

De kracht van het uniform vastleggen van al die data zit ‘m in de mogelijkheid om patronen te herkennen. Zonder betrouwbare data is het onmogelijk om trends te herkennen, behandelingen te monitoren en te verbeteren, zorg te plannen of preventiemaatregelen/beleid te evalueren. Daarom is het goed en transparant coderen en structureren van data essentieel om ze veilig te kunnen gebruiken.


Wat IKNL toevoegt

  • Ontwikkelde RANK als landelijk registratiesysteem, specifiek voor de oncologie.

  • Zorgt dat datamanagers via codeerregels en itemsets per tumorsoort uniform registreren.

  • Past internationale coderingen en regels toe (ICD-O, TNM, ENCR, IACR) voor wereldwijde vergelijkbaarheid.

  • Valideert en controleert data op volledigheid en logische samenhang.

  • Maakt de itemsets en coderingen transparant.


Verbinding met de volgende stap

Nu de gegevens betrouwbaar en veilig zijn vastgelegd en gestructureerd gecodeerd, kunnen ze gebruikt worden in onderzoek en statistiek. Bijvoorbeeld door ze op te slaan in het internationale OMOP-Common Data Model van OHDSI. Dit maakt standaardisatie en integratie van gegevens mogelijk, waardoor de analyse van observationele gegevens uniform wordt. Maar hoe bepaal je welke data nodig zijn — en wat je juist niet moet opvragen?
In aflevering 3 lees je hoe IKNL-analisten samenwerken met onderzoekers, waarbij dataminimalisatie en kennis van de NKR het verschil maken.