Publicera data

Dela och publicera data med personuppgifter

Öppna data

Forskningsdata som tillgängliggörs via ändamålsenliga repositorier blir sökbara, citerbara och ger upphovsmännen fler möjligheter till genomslag, meritering och framtida samarbeten. Att publicera och göra forskningsdata öppet tillgängliga ger ökad transparens och tillförlitlighet för presenterade resultat och publikationer. Det ger även andra möjlighet att hitta och återanvända befintliga data i ny forskning.

Alla data kan inte delas

Det kan finnas juridiska och/eller etiska skäl att inte dela eller publicera forskningsdata. Det gäller exempelvis data som innehåller personuppgifter och som då omfattas av dataskyddsförordningen (GDPR) eller annan lagstiftning. Det kan även gälla information som är sekretessbelagd enligt OSL (SFS 2009:400), som innehåller företagshemligheter, är upphovsrättsskyddat av någon annan eller som innehåller annan information som av juridiska eller etiska skäl inte bör spridas. Även om vissa data inte direkt kan delas, publiceras eller göras öppet tillgängligt kan de ändå registreras så utförligt som möjligt i ett repositorium och därmed göras sökbara. Då kan du även ange kontaktpersoner och de förutsättningar och villkor som finns för att få tillgång till data. Det är ett utmärkt sätt att öka datas FAIRness då metadata och metadatastandarder är centralt för FAIR-principerna.

Repositorier och identifierare

Det finns många repositorier för att dela och publicera forskningsdata. Välj gärna etablerade ämnesspecifika datarepositorier i första hand. I re3data.org – Registry of research data repositories – kan du söka efter repositorier inom olika ämnesområden och länder. Du hittar också en lista över ämnesspecifika repositorier hos The Open Access Directory (OAD). I ditt val av ämnesrepositorium kan du också ta del av rekommendationer och guider som många förlag erbjuder, t ex Nature. Några exempel på ämnesspecifika repositorier är:

CESSDA – samhällsvetenskap.
DARIAH – humaniora.
ELIXIR – livsvetenskap life science. Här hittar du Elixirs lista över rekommenderade databaser, t ex BioStudies.
HEPData – högenergifysik.
NOMAD – materialvetenskap.
SBDI – biologisk mångfald.
SICAS Medical Image Repository – medicin.

När du ska välja repositorium, undersök vilka riktlinjer din tidskrift, ditt förlag eller din finansiär har för delning och publicering av data. Europeiska kommissionen rekommenderar att forskare använder sig av certifierade repositorier som stödjer öppna data.

En fördel med ämnesspecifika repositorier är att metadatafälten är mer detaljerade och genom att ämnesspecifika vokabulärer kan användas, blir beskrivningen av materialet bättre. Generella datarepositorier kan ha fördelen att data får större tvärvetenskaplig räckvidd.

Att repositorier har maskinläsbara metadata och vedertagna metadatastandarder ökar också möjligheten till återanvändning och spridning.

Välj helst ett repositorium som gör att dina data ges persistenta identifierare (PID), exempelvis DOI. Läs mer om identifierare nedan.

Exempel på ämnesövergripande repositorier där forskare vid Uppsala universitet kan göra forskningsdata öppet tillgängliga utan kostnad:

SND – Svensk nationell datatjänst är en svensk forskningsinfrastruktur som drivs av ett konsortium av nio lärosäten. I SND:s repositorium, som är certifierat enligt CoreTrustSeal, kan du som forskare publicera dataset och metadata. Du loggar in med din universitetsinloggning. I SND:s registreringsformulär för dataset är det möjligt att söka fram och länka till publikationer registrerade i DiVA eller i SwePub. När du publicerar dataset i SNDs repositorium tilldelas det en persistent identifierare, DOI, och blir sökbart i SNDs katalog, Web of Science och DataCite. Dataset som deponeras hos SND beskrivs enligt metadatastandarden DDI (Data Documentation Initiative). Läs mer om hur du registrerar dataset i DORIS.
Data som registreras i SNDs repositorium kureras av Uppsala universitets forskningsdatastöd i dialog med dig som forskare, i syfte att göra data så FAIR som möjligt.
DiVA Uppsala universitets publikationsdatabas och publiceringsplattform.
OBS! Från den 15 maj går det inte att registrera dataset i DiVA längre, men registrering av nya dataset kan göras i SND:s repositorium (DORIS).
De befintliga dataseten i DiVA kommer efter den 15 maj att flyttas över till SND. Därefter görs en omdirigering av URN:NBN för de flyttade posterna så att länkarna fortsätter att fungera och pekar på posterna i DORIS istället.
Zenodo Ett repositorium som drivs av OpenAIRE och CERN med finansiering från EU-kommissionen. Kan användas för lagring och delning av dataset, programkod och annan forskningsdata. När det gäller programkod kan man via Zenodo lagra en kopia i Github och generera en identifierare i form av DOI.
Figshare Ett öppet datarepositorium som företaget Digital Science står bakom.
Dryad Skapad av National Evolutionary Synthesis Center, UNC-CH Metadata Research Center, Oxford University, The British Library och California Digital Library.
GitHub Företaget Microsoft står bakom.
Dataverse Harvard University står bakom.

Det är också möjligt att tillgängliggöra dataset som supplementmaterial i samband med artikelpublicering eller via datatidskrifter. SND har en lista över datatidskrifter inom olika områden.

Vid publicering i ett repositorium får ett dataset en unik och beständig identifierare, en PID (persistent identifier). PID:en är maskinläsbar och hållbar över tid till skillnad från url-länkar. En PID består av ett unikt id-nummer eller en kodsträng. Olika typer av PID:ar används beroende på vad som ska identifieras och vilken organisation som står bakom dem. En PID kan leda till en landningssida där data är beskrivet, till filer eller dokument eller användas för att identifiera personer och organisationer. Några exempel är DOI (för data och publikationer), ORCID (för forskare och akademiker),ISBN (för böcker) och ISSN (för tidskrifter) och ROR (för forskningsorganisationer).

Tänk på att vid publicering av ett dataset kan angivna upphovsmän och roller vara andra än de som anges i publikationer vars analys och resultat bygger på dessa data. För exempel på roller se CRediT – Contributor Roles Taxonomy. FORCE11 Research Data Publishing Ethics Working Group har i samarbete med Committee on Publication Ethics (COPE) utarbetat en rekommendation kring frågor om upphovsmannaskap för dataset.

Licenser

För att underlätta återanvändning av publicerade data kan man ange eventuella villkor för användning, exempelvis med hjälp av Creative Commons licenser eller Open Data Commons. Villkoren kan beskriva sådant som korrekt citering, om bearbetningar och kommersiell användning är tillåtet och om data kan delas vidare. Licensiering av data är ett viktigt steg i att göra data FAIR. Läs mer om FAIR data. Vissa tidskrifter har också krav på licensiering av data.

DIGG, Myndighet för digital förvaltning, har utarbetat riktlinjer för licensiering med öppna licenser. De rekommenderar att data som inte är föremål för upphovsrättsligt eller annat immaterialrättsligt skydd har märkningen PDM (Public Domain Mark) eller CC0. Data som omfattas av upphovsrätt bör, enligt DiGG, tilldelas licensen CC-BY 4.0.

Du kan du läsa mer om licensiering av data i en nationell kontext hos SND.

Några användbara länkar om licenser för kod, datorprogram och databaser:

För att välja licens till programvara med öppen källkod har GitHub skapat verktyget Choose a licence.
Joinup Licensing Assistant (JLA) – Ett verktyg, tillhandahållet av Europeiska kommissionens Joinup, för att hitta och jämföra licenser för mjukvara.
Open Source Initiative listar licenser för mjukvara och har en läsvärd FAQ om ämnet.
Europeiska unionens licens till öppen källkod
Open Data Commons Open Database License (ODbL) – En öppen licens för databaser, från Open Knowledge Foundation.