Synthetische dataset

Synthetische data zijn kunstmatig gegenereerde data op basis van de statistische eigenschappen van een bestaande dataset, zonder herleidbare gegevens over echte personen. IKNL biedt een synthetische dataset van de NKR aan die de structuur en enkele statistische patronen uit de NKR nabootst. 

Deze dataset is bedoeld voor onderzoekers die de willen verkennen welke analyses met NKR-gegevens mogelijk zijn. Zo bepaalt u eenvoudiger welke gegevens u nodig heeft om uw onderzoeksvraag te beantwoorden en kunt  u gerichter een gegevensaanvraag indienen. De synthetische data zijn daarnaast bruikbaar voor de ontwikkeling en test van software of analysemethoden met realistische uitkomsten.

Let op: resultaten uit synthetische data zijn niet geschikt voor klinische besluitvorming en niet bedoeld voor wetenschappelijke publicaties over kanker.

Welke gegevens zitten in de synthetische data?

Op dit moment is een synthetische dataset beschikbaar met een selectie van NKR-items voor borstkankerpatiënten. IKNL is voornemens de dataset uit te breiden met meerdere tumorsoorten. Suggesties van gebruikers helpen om toekomstige versies nóg beter aan te laten sluiten met op oriëntatie en methodetoetsing.

Beschikbare formaten

U kunt de synthetische dataset in  verschillende versies ontvangen: 

  • Reguliere dataset (standaard NKR-format) 
  • OMOP Common Data Model (OMOP-CDM) 

U kunt er ook voor kiezen om de reguliere dataset zelf om te zetten naar OMOP-CDM. 

Synthetische dataset aanvragen

Vul het onderstaande formulier in en stuur her naar gegevensaanvraag@iknl.nl.

Met het retourneren van het aanvraagformulier gaat u akkoord met de voorwaarden voor aanvraag van de synthetische dataset.. 

Voorwaarden aanvraag synthetische dataset NKR

Artikel 1

Deze voorwaarden zijn van toepassing op de levering van de NKR synthetische dataset zoals door u aangevraagd.

Artikel 2

Na ontvangst van het aanvraagformulier wordt deze beoordeeld door IKNL op volledigheid. U dient de verplichte velden in te vullen. IKNL neemt een onvolledige aanvraag niet in behandeling.

Artikel 3

Alle mogelijke rechten van intellectueel eigendom, waaronder de databankrechten, op de synthetische dataset liggen bij IKNL.

IKNL verleent u een niet-exclusief en niet-overdraagbaar gebruiksrecht op de synthetische dataset. Dit gebruiksrecht is ongelimiteerd in tijd.

Indien u in strijd handelt met deze voorwaarden of anderszins inbreuk makend handelt dan is IKNL gerechtigd om het verleende gebruiksrecht te beëindigen. U beëindigt het gebruik van de NKR synthetische dataset na kennisgeving van IKNL hiervan in dat geval onmiddellijk. 

Het door IKNL verleende gebruiksrecht geldt uitsluitend voor u en eventueel voor degenen die binnen uw organisatie betrokken zijn bij de werkzaamheden in het kader van het in het aanvraagformulier omschreven doel.

Het is niet toegestaan het verleende gebruiksrecht te sub-licentiëren. Met andere woorden u mag de synthetische dataset niet delen met andere partijen en onder geen beding commercieel exploiteren.

Artikel 4

U gaat zorgvuldig om met de door IKNL verstrekte synthetische data en neemt de toepasselijke wet- en regelgeving en gedragscodes in acht.

U gebruikt de synthetische data uitsluitend voor de in het aanvraagformulier genoemde doeleinden. Indien u de synthetische data voor een nieuwe toepassing wilt gebruiken dan vernemen wij graag ook dit aanvullende doel.

Artikel 5

De door IKNL gecommuniceerde levertermijnen zijn indicatief en houden een inspanningsverplichting in.

Artikel 6

U bent zich er van bewust dat het gaat om nagebootste data. Indien u de synthetische data gaat gebruiken voor de ontwikkeling van software of analysemethodes met realistische resultaten, dan is het niet toegestaan deze resultaten voor klinische besluitvorming te gebruiken of voor wetenschappelijke publicaties over kanker.

Het is toegestaan om de synthetische dataset te wijzigen. Het is niet toegestaan de al dan niet bewerkte synthetische data te publiceren.

Artikel 7

IKNL spant zich in om de synthetische dataset zo accuraat mogelijk te doen zijn maar kan dit niet garanderen. 

IKNL is niet aansprakelijk voor de verstrekking van onjuiste of onvolledige synthetische data.

IKNL is niet verantwoordelijk en/of aansprakelijk voor door u en/of derden geleden schade die rechtstreeks of indirect voortvloeit uit of tot stand komt in verband met de verstrekking van de synthetische dataset, tenzij deze schade voortvloeit uit een tekortkoming door IKNL in de nakoming van haar verplichtingen voortvloeiend uit de tussen u en IKNL bestaande afspraken waaronder deze voorwaarden.

De totale aansprakelijkheid van IKNL wegens een toerekenbare tekortkoming in de nakoming van de afspraken of uit enige andere hoofde, waaronder eventuele garantie en/of vrijwaringsverplichtingen, is beperkt tot vergoeding van directe schade tot een bedrag ter hoogte van hetgeen door de verzekering zal worden uitgekeerd.

 

Veelgestelde vragen - Synthetische data NKR

Bestaat synthetische data uit echte patiëntgegevens?

Nee. Synthetische data bevatten geen gegevens van echte patiënten. De rijen zijn gecreëerd op basis van statistische kansverdelingen. Eventuele overeenkomsten met individuele patiënten berusten op toeval en zijn om die reden nooit bekend.

Waar kan synthetische data voor worden gebruikt?

De synthetische data:

  • laten zien welke items in de NKR worden geregistreerd, zodat u een gerichte gegevensaanvraag kunt indienen
  • kunnen worden gebruikt voor ontwikkeling en test van software of analysemethoden met realistische outputs

Let op: resultaten op basis van synthetische data zijn niet geschikt voor klinische besluitvorming en niet bedoeld voor wetenschappelijke publicaties over kanker.

Kan ik mijn software of code delen om deze te testen op echte NKR-data?

Ja. U kunt uw code of software delen met IKNL. Als u deze wilt laten testen op echte NKR-data, doorlopen we het standaardproces voor een gegevensaanvraag. Na goedkeuring voert IKNL de test uit binnen de beveiligde omgeving en deelt IKNL de niet-herleidbare uitkomsten met u (uitsluitend resultaten zonder privacygevoelige informatie).

Hoe kan ik de synthetische data citeren?

Gebruik voor verkenningsdoeleinden en softwareontwikkeling onderstaande referentie (niet voor klinisch onderzoek of wetenschappelijke publicaties):

Synthetische dataset Nederlandse Kankerregistratie (NKR), Integraal Kankercentrum Nederland (IKNL).
Beschikbaar via: https://iknl.nl/nkr/cijfers-op-maat/synthetische-dataset.

Meer weten?

Vragen of suggesties? Mail gegevensaanvraag@iknl.nl.