Synthetische dataset NKR beschikbaar voor onderzoekers
Voor onderzoekers die laagdrempelig de mogelijkheden voor analyses met gegevens uit de Nederlandse Kankerregistratie (NKR) willen verkennen is er nu een synthetische dataset beschikbaar. De synthetische dataset bootst de structuur en enkele statistische patronen van een deel van de NKR na. De data bevat geen gegevens van patiënten en geeft dus geen privacygevoelige gegevens prijs.
Met de synthetische data kunnen onderzoekers analysemogelijkheden met data uit de Nederlandse Kankerregistratie verkennen, zonder dat zij toegang krijgen tot privacygevoelige gegevens. Door te oriënteren op NKR data met de synthetische dataset wordt het eenvoudiger voor onderzoekers om te bepalen welke gegevens zij nodig hebben om hun onderzoeksvraag te beantwoorden en zo een gerichte gegevensaanvraag bij IKNL in te dienen. Daarnaast kan de synthetische data ook gebruikt worden voor de ontwikkeling van software of analysemethodes met realistische resultaten. Echter willen we benadrukken dat deze resultaten niet voor klinische besluitvorming kunnen worden gebruikt en dat het niet gebruikt kan worden voor wetenschappelijke publicaties over kanker.
Welke gegevens zitten in de synthetische data?
Deze eerste versie van de synthetische dataset bestaat uit een deel van de items die we registeren voor borstkankerpatiënten. We zijn van plan de synthetische dataset uit te breiden met meerdere tumorsoorten, de eerst volgende tumorsoort waarop wij ons richten is darmkanker.