Publicera data
Forskningsdata som beskrivs och görs öppet tillgängliga via datarepositorier blir sökbara, citerbara och ger fler möjligheter till genomslag, meritering och framtida samarbeten för upphovsmännen. Att publicera data ger även ökad transparens och tillförlitlighet för presenterade resultat, samt möjlighet för andra att hitta och återanvända befintliga data i ny forskning.
Vissa data bör inte delas öppet
Det kan finnas juridiska och/eller etiska skäl att inte dela eller publicera forskningsdata. Det kan gälla för data som innehåller personuppgifter och annan information som kan beläggas med sekretess enligt offentlighets och sekretesslagen (SFS 2009:400), exempelvis företagshemligheter och upphovsrättsskyddat material.
Även om vissa data inte direkt kan göras öppet tillgängligt kan de ändå registreras i ett repositorium och därmed bli sökbara. Beskrivningen av data bör då omfatta kontaktpersoner och förutsättningar för att få tillgång till data. Om du hanterar data med känsliga personuppgifter och planerar att deponera data i repositorier med rutiner för kontrollerad utlämning bör du inkludera den informationen i ansökan om etikprövning.
Dela och publicera data med personuppgifter
Om anonymisering, publicering och risk för återidentifiering
Repositorier och identifierare
Välj gärna etablerade ämnesspecifika datarepositorier för att dela och publicera forskningsdata. I re3data.org – Registry of research data repositories – kan du söka efter repositorier inom olika ämnesområden och länder.
Exempel på ämnesspecifika repositorier
- CESSDA – samhällsvetenskap.
- DARIAH – humaniora.
- ELIXIR deposition databases for biomolecular data
- FEGA Sweden – repositorium med kontrollerad delning av genomikdata.
- HEPData – högenergifysik.
- NOMAD – materialvetenskap.
- PANGAEA – geo- och biovetenskap.
- Swedish Biodiversity Data Infrastructure – biologisk mångfald.
- SciLifeLab Data Repository – livsvetenskap.
Exempel på ämnesövergripande repositorier
- Svensk nationell datatjänst (SND) - certifierat repositorium där registrerade data granskas av Uppsala universitets forskningsdatastöd i dialog med dig som forskare i syfte att göra data så FAIR som möjligt.
- Zenodo - repositorium som drivs av OpenAIRE och CERN med finansiering från EU-kommissionen. Kan användas för publicering av data, programkod och publikationer. Programkod som skapats i Github kan kan publiceras via Zenodo och tilldelas ett DOI-nummer.
- Figshare - datarepositorium som företaget Digital Science står bakom.
- Dryad - repositorium som drivs av ett nätverk av lärosäten, vetenskapliga sällskap och förlag.
Mer utförliga beskrivningar av datamängder kan göras i ett "data paper".
Vid publicering i ett repositorium får ett dataset vanligtvis en unik och beständig identifierare, en PID (persistent identifier). PID:en är maskinläsbar och hållbar över tid till skillnad från URL-länkar. En PID kan leda till den landningssida där data är beskrivet eller till enskilda filer eller dokument.
Tänk på att vid publicering av ett dataset kan angivna upphovsmän och roller vara andra än de som anges i publikationer vars analys och resultat bygger på dessa data. För exempel på roller se CRediT – Contributor Roles Taxonomy. FORCE11 och Committee on Publication Ethics (COPE) utarbetat en rekommendation kring frågor om upphovsmannaskap för dataset.
Licenser
För att underlätta återanvändning av publicerade data kan man ange eventuella villkor för användning, exempelvis med hjälp av Creative Commons licenser eller Open Data Commons. Villkoren kan beskriva sådant som korrekt citering, om bearbetningar och kommersiell användning är tillåtet och om data kan delas vidare.
DIGG, Myndighet för digital förvaltning, har utarbetat riktlinjer för öppna licenser och immaterialrätt. De rekommenderar att data som inte är föremål för upphovsrättsligt eller annat immaterialrättsligt skydd har märkningen PDM (Public Domain Mark) eller CC0. Data som omfattas av upphovsrätt bör, enligt DiGG, tilldelas licensen CC-BY 4.0.
Du kan du läsa mer om licensiering av data i en nationell kontext hos Svensk nationell datatjsänst.
Några länkar om licenser för kod, datorprogram och databaser
- För att välja licens till programvara med öppen källkod har GitHub skapat verktyget Choose a licence.
- Licensing Assistant – ett verktyg för att hitta och jämföra licenser för mjukvara.
- Open Source Initiative listar licenser för mjukvara och har en läsvärd FAQ om ämnet.
- Europeiska unionens licens till öppen källkod
- Open Data Commons Open Database License (ODbL) – En öppen licens för databaser, från Open Knowledge Foundation.