Synthetische dataset

De synthetische dataset bootst een deel van de Nederlandse Kankerregistratie (NKR) na. Deze synthetische dataset is beschikbaar voor onderzoekers die de mogelijkheden voor analyses met gegevens uit de NKR willen verkennen. In deze dataset zitten geen echte patiëntgegevens. De data oogt realistisch, maar is niet echt en geeft dus geen privacygevoelige gegevens prijs.

De structuur en enkele statistische patronen in de NKR worden nagebootst in de synthetische data. Hierdoor wordt het eenvoudiger voor onderzoekers om te bepalen welke gegevens zij nodig hebben om hun onderzoeksvraag te beantwoorden en zo een gerichte gegevensaanvraag in te dienen.

Daarnaast kan de synthetische data ook gebruikt worden voor de ontwikkeling van software of analysemethodes met realistische resultaten. Echter willen we benadrukken dat deze resultaten niet voor klinische besluitvorming kunnen worden gebruikt en niet voor wetenschappelijke publicaties over kanker.

Met de synthetische data kunnen onderzoekers de analysemogelijkheden met NKR data beter verkennen, zonder dat zij toegang krijgen tot privacygevoelige gegevens.

Welke gegevens zitten in de synthetische data?

Deze eerste versie van de synthetische dataset bestaat uit een deel van de items die we registeren voor borstkankerpatiënten. We zijn van plan de synthetische dataset uit te breiden met meerdere tumorsoorten en nemen daarbij graag suggesties van gebruikers mee. Hierdoor kunnen we ervoor zorgen dat toekomstige versies van de synthetische data nog behulpzamer zijn voor onderzoekers die zich op de data willen oriënteren.

Voor informatie over alle items die in de NKR zijn geregistreerd kunt u de NKR Catalogus en de itemsets raadplegen.

Verschillende versies van de synthetische dataset

U kunt van de synthetische dataset verschillende versie ontvangen.
Er kan een reguliere dataset worden geleverd met de variabelen in het standaard NKR format of een versie volgens het Observational Medical Outcomes Partnership (OMOP) Common Data Model (CDM).
Voor de OMOP-CDM versie kan u uit 2 varianten kiezen. Op het aanvraagformulier kunt u aangeven welke versie(s) u wilt ontvangen.
•    Reguliere dataset 
•    OMOP-CDM dataset waarbij u zelf online de reguliere dataset omzet naar OMOP-CDM format
•    OMOP-CDM dataset waarbij u de data direct in OMOP-CDM format ontvangt

Synthetische dataset aanvragen

Vul het volgende formulier in om de synthetische data aan te vragen. Stuur het formulier naar: gegevensaanvraag@iknl.nl

Door het retourneren van het aanvraagformulier gaat u akkoord met de voorwaarden voor aanvraag van de synthetische dataset. 

Voorwaarden aanvraag synthetische dataset NKR

Artikel 1

Deze voorwaarden zijn van toepassing op de levering van de NKR synthetische dataset zoals door u aangevraagd.

Artikel 2

Na ontvangst van het aanvraagformulier wordt deze beoordeeld door IKNL op volledigheid. U dient de verplichte velden in te vullen. IKNL neemt een onvolledige aanvraag niet in behandeling.

Artikel 3

Alle mogelijke rechten van intellectueel eigendom, waaronder de databankrechten, op de synthetische dataset liggen bij IKNL.

IKNL verleent u een niet-exclusief en niet-overdraagbaar gebruiksrecht op de synthetische dataset. Dit gebruiksrecht is ongelimiteerd in tijd.

Indien u in strijd handelt met deze voorwaarden of anderszins inbreuk makend handelt dan is IKNL gerechtigd om het verleende gebruiksrecht te beëindigen. U beëindigt het gebruik van de NKR synthetische dataset na kennisgeving van IKNL hiervan in dat geval onmiddellijk. 

Het door IKNL verleende gebruiksrecht geldt uitsluitend voor u en eventueel voor degenen die binnen uw organisatie betrokken zijn bij de werkzaamheden in het kader van het in het aanvraagformulier omschreven doel.

Het is niet toegestaan het verleende gebruiksrecht te sub-licentiëren. Met andere woorden u mag de synthetische dataset niet delen met andere partijen en onder geen beding commercieel exploiteren.

Artikel 4

U gaat zorgvuldig om met de door IKNL verstrekte synthetische data en neemt de toepasselijke wet- en regelgeving en gedragscodes in acht.

U gebruikt de synthetische data uitsluitend voor de in het aanvraagformulier genoemde doeleinden. Indien u de synthetische data voor een nieuwe toepassing wilt gebruiken dan vernemen wij graag ook dit aanvullende doel.

Artikel 5

De door IKNL gecommuniceerde levertermijnen zijn indicatief en houden een inspanningsverplichting in.

Artikel 6

U bent zich er van bewust dat het gaat om nagebootste data. Indien u de synthetische data gaat gebruiken voor de ontwikkeling van software of analysemethodes met realistische resultaten, dan is het niet toegestaan deze resultaten voor klinische besluitvorming te gebruiken of voor wetenschappelijke publicaties over kanker.

Het is toegestaan om de synthetische dataset te wijzigen. Het is niet toegestaan de al dan niet bewerkte synthetische data te publiceren.

Artikel 7

IKNL spant zich in om de synthetische dataset zo accuraat mogelijk te doen zijn maar kan dit niet garanderen. 

IKNL is niet aansprakelijk voor de verstrekking van onjuiste of onvolledige synthetische data.

IKNL is niet verantwoordelijk en/of aansprakelijk voor door u en/of derden geleden schade die rechtstreeks of indirect voortvloeit uit of tot stand komt in verband met de verstrekking van de synthetische dataset, tenzij deze schade voortvloeit uit een tekortkoming door IKNL in de nakoming van haar verplichtingen voortvloeiend uit de tussen u en IKNL bestaande afspraken waaronder deze voorwaarden.

De totale aansprakelijkheid van IKNL wegens een toerekenbare tekortkoming in de nakoming van de afspraken of uit enige andere hoofde, waaronder eventuele garantie en/of vrijwaringsverplichtingen, is beperkt tot vergoeding van directe schade tot een bedrag ter hoogte van hetgeen door de verzekering zal worden uitgekeerd.

 

Veelgestelde vragen – Synthetische data NKR

Bestaat de synthetische data uit echte patiëntgegevens?

Nee, synthetische data bevatten geen gegevens van echte patiënten. De rijen zijn gecreëerd op basis van statistische kansverdelingen. Eventuele overeenkomsten met individuele patiënten berusten dus enkel op toeval en zijn om die reden nooit bekend.

Waar kan de synthetische data voor worden gebruikt?

De synthetische data geeft inzicht in de items die worden geregistreerd in de NKR, waardoor het makkelijker wordt om een gegevensaanvraag in te dienen. De synthetische data kan ook gebruikt worden om software te ontwikkelen. Deze software kan dan gedeeld worden als deel van een gegevensaanvraag. IKNL-medewerkers kunnen vervolgens op een veilige manier de software testen op echte data uit de Nederlandse Kankerregistratie, zonder dat de softwareontwikkelaar toegang krijgt tot deze patiëntgegevens.

Kan ik mijn software of code delen om deze te testen op de echte data?

Ja, onderzoekers kunnen hun code delen met IKNL. Indien, de onderzoeker deze wil testen op de echte data, zullen we het standaardproces voor een gegevensaanvraag doorlopen. Bij goedkeurig van de aanvraag, zal IKNL de resultaten delen indien deze geen privacygevoelige informatie bevatten.

Hoe kan ik de synthetische data citeren?

We benadrukken graag dat de synthetische data niet gebruikt kan worden voor klinisch onderzoek. De resultaten die hieruit worden verkregen zijn gebaseerd op synthetische data en kunnen sterk afwijken van de realiteit. Echter, kan de synthetische data wel worden gebruikt voor verkenningsdoeleinden en softwareontwikkeling. Hiervoor kunt de volgende referentie gebruiken:

Synthetische dataset Nederlandse Kankerregistratie (NKR), Integraal Kankercentrum Nederland (IKNL). https://iknl.nl/NKR/cijfers-op-maat/synthetische-data

 

Contact

Indien u nog vragen of suggesties heeft met betrekking tot de synthetische data, stuur dan een mail naar: gegevensaanvraag@iknl.nl