Synthetische dataset

De synthetische dataset bootst een deel van de Nederlandse Kankerregistratie (NKR) na. Deze synthetische dataset is beschikbaar voor onderzoekers die de mogelijkheden voor analyses met gegevens uit de NKR willen verkennen. In deze dataset zitten geen echte patiëntgegevens. De data oogt realistisch, maar is niet echt en geeft dus geen privacygevoelige gegevens prijs.

De structuur en enkele statistische patronen in de NKR worden nagebootst in de synthetische data. Hierdoor wordt het eenvoudiger voor onderzoekers om te bepalen welke gegevens zij nodig hebben om hun onderzoeksvraag te beantwoorden en zo een gerichte gegevensaanvraag in te dienen.

Daarnaast kan de synthetische data ook gebruikt worden voor de ontwikkeling van software of analysemethodes met realistische resultaten. Echter willen we benadrukken dat deze resultaten niet voor klinische besluitvorming kunnen worden gebruikt en dat het niet gebruikt kan worden voor wetenschappelijke publicaties over kanker.

Met de synthetische data kunnen onderzoekers de analyse mogelijkheden met NKR data beter verkennen, zonder dat zij toegang krijgen tot privacygevoelige gegevens.

Welke gegevens zitten in de synthetische data?

Deze eerste versie van de synthetische dataset bestaat uit een deel van de items die we registeren voor borstkankerpatiënten. We zijn van plan de synthetische dataset uit te breiden met meerdere tumorsoorten en nemen daarbij graag suggesties van gebruikers mee. Hierdoor kunnen we ervoor zorgen dat toekomstige versies van de synthetische data nog behulpzamer zijn voor onderzoekers die zich op de data willen oriënteren.

Downloaden van de synthetische data

Vul het volgende formulier in om de synthetische data te downloaden, in te vullen en te sturen naar: syntheticdata@iknl.nl

Door het retourneren van het aanvraagformulier gaat u akkoord met de voorwaarden voor aanvraag van de synthetische dataset. 

Voorwaarden aanvraag synthetische dataset NKR

Artikel 1

Deze voorwaarden zijn van toepassing op de levering van de NKR synthetische data set zoals door u aangevraagd.

Artikel 2

Na ontvangst van het aanvraagformulier wordt deze beoordeeld door IKNL op volledigheid. U dient de verplichte velden in te vullen. IKNL zal de aanvraag anders niet in behandeling nemen.

Artikel 3

Alle mogelijke rechten van intellectuele eigendom, waaronder de databankrechten, op de synthetische dataset liggen bij IKNL.

IKNL verleent u een niet-exclusief en niet-overdraagbaar gebruiksrecht op de synthetische dataset. Dit gebruiksrecht is niet gelimiteerd in tijd.

Indien u in strijd handelt met deze voorwaarden of anderszins inbreuk makend handelt dan is IKNL gerechtigd om het verleende gebruiksrecht te beëindigen. U zal het gebruik van de NKR synthetische dataset na kennisgeving van IKNL hiervan onmiddellijk beëindigen. 

Het door IKNL verleende gebruiksrecht geldt uitsluitend voor u en eventueel voor degenen die binnen uw organisatie betrokken zijn bij de werkzaamheden in het kader van het in het aanvraagformulier omschreven doel.

Het is niet toegestaan het verleende gebruiksrecht te sub-licentieren. M.a.w. u mag de synthetische dataset niet delen met andere partijen en onder geen beding commercieel exploiteren.

Artikel 4

U zal zorgvuldig omgaan met de door IKNL verstrekte synthetische data en zal toepasselijke wet- en regelgeving en gedragscodes in acht nemen.

U zal de synthetische data uitsluitend gebruiken voor de in het aanvraagformulier genoemde doeleinden. Indien u de synthetische data voor een nieuwe toepassing wilt gebruiken dan vernemen wij graag ook dit aanvullende doel.

Artikel 5

De door IKNL gecommuniceerde levertermijnen zijn indicatief en houden een inspanningsverplichting in.

Artikel 6

U bent zich er van bewust dat het gaat om nagebootste data. Indien u de synthetische data gaat gebruiken voor de ontwikkeling van software of analysemethodes met realistische resultaten, dan is het niet toegestaan deze resultaten voor klinische besluitvorming te gebruiken of voor wetenschappelijke publicaties over kanker.

Het is toegestaan om de synthetische dataset te wijzigen. Het is niet toegestaan de al dan niet bewerkte synthetische data te publiceren.

Artikel 7

IKNL spant zich in om de synthetische dataset zo accuraat mogelijk te doen zijn maar kan dit niet garanderen. 

IKNL is niet aansprakelijk voor de verstrekking van onjuiste / onvolledige synthetische data.

IKNL is niet verantwoordelijk en / of aansprakelijk voor door u en / of derden geleden schade die rechtstreeks of indirect voortvloeit uit of tot stand komt in verband met de verstrekking van de synthetische dataset, tenzij deze schade voortvloeit uit een tekortkoming door IKNL in de nakoming van haar verplichtingen voortvloeiend uit de tussen u en IKNL bestaande afspraken waaronder deze voorwaarden.

De totale aansprakelijkheid van IKNL wegens een toerekenbare tekortkoming in de nakoming van de afspraken of uit enige andere hoofde, waaronder eventuele garantie en/of vrijwaringsverplichtingen, is beperkt tot vergoeding van directe schade tot een bedrag ter hoogte van hetgeen door de verzekering zal worden uitgekeerd.

 

Veelgestelde vragen – Synthetische data NKR

Bestaat de synthetische data uit echte patiëntgegevens?

Nee, synthetische data bevat geen gegevens van echte patiënten. De rijen zijn gecreëerd op basis van statistische kansverdelingen. Eventuele overeenkomsten met individuele patiënten berusten dus enkel op toeval en zijn om die reden nooit bekend.

Waar kan de synthetische data voor worden gebruikt?

De synthetische data geeft inzicht in de items die worden geregistreerd in de NKR, waardoor het makkelijker wordt om een gegevensaanvraag in te dienen. De synthetische data kan ook gebruikt worden om software te ontwikkelen. Deze software kan dan gedeeld worden als deel van een gegevensaanvraag. IKNL medewerkers kunnen vervolgens op een veilige manier de software testen op echte data uit de Nederlandse Kankerregistratie, zonder dat de software ontwikkelaar toegang krijgt tot deze patiëntgegevens.

Kan ik mijn software of code delen om deze te testen op de echte data?

Ja, onderzoekers kunnen hun code delen met IKNL. Indien, de onderzoeker deze wil testen op de echte data, zullen we het standaard proces voor een gegevensaanvraag doorlopen. Bij goedkeurig van de aanvraag, zal IKNL de resultaten delen indien deze geen privacygevoelige informatie bevatten.

Hoe kan ik de synthetische data citeren?

We benadrukken graag dat de synthetische data niet gebruikt kan worden voor klinisch onderzoek. De resultaten die hieruit worden verkregen zijn gebaseerd op synthetische data en kunnen sterk afwijken van de realiteit. Echter, kan de synthetische data wel worden gebruikt voor verkenningsdoeleinden en software ontwikkeling. Hiervoor kunt de volgende referentie gebruiken:

Synthetische dataset Nederlandse Kankerregistratie (NKR), Integraal Kankercentrum Nederland (IKNL). https://iknl.nl/NKR/cijfers-op-maat/synthetische-data

 

Contact

Indien u nog vragen of suggesties met betrekking tot de synthetische data, dan kunt u ons een mail sturen naar: syntheticdata@iknl.nl