Datahanteringsplan - innehåll
En datahanteringsplan (DHP) beskriver hur forskningsdata i ett projekt hanteras under och efter projekttiden. Innehållet styrs av förutsättningarna för det enskilda projektet, men anvisningar från exempelvis forskningsfinansiärer kan påverka vilka uppgifter som bör ingå. Det finns mallar för DHP:er som kan användas för att skapa en struktur. Översikten nedan följer i huvudsak delarna i den mall som Vetenskapsrådet (VR) och Sveriges universitets- och högskoleförbund (SUHF) har tagit fram. VR har även en utförlig vägledning till mallen.
Administrativa uppgifter
Denna del innehåller information om det forskningsprojekt där data kommer att hanteras.
Ange här uppgifter som projektnamn, kortfattad projektbeskrivning, projektledare, medverkande forskare, forskningshuvudman, finansiär, diarienummer eller motsvarande samt datum och version av datahanteringsplanen. Det ska framgå vilka som är involverade i projektet, både individer och organisationer.
Beskrivning av data
Här beskrivs hur forskningsdata kommer att samlas in, skapas eller återanvändas. Vilken typ av data som projektet hanterar (ex. tabulära data, enkätsvar, mätningar, filmer), förväntad volym och de format som kommer att användas.
Ange hur uppgifterna kommer att samlas in och behandlas. Vilka standarder och metoder används. Är de data som skapas reproducerbara (t.ex. skapade via experiment) eller inte (t.ex. deltagande observationer, intervjuer)?
Om befintliga datamängder återanvänds, hur kan de integreras med andra data och hur hanteras frågor som rör upphovsrätt, licenser och immateriella rättigheter?
Vilka format kommer att användas? – exempelvis textfiler (.txt), komma-separerade värden (.csv), georefererad data (.tif, .tfw), disciplinspecifika format (ex. CIF inom kemi). Om data skapas via ett instrument, ange instrumentnamn och version/format.
Är valda format kompatibla med öppna standarder och hur påverkar formatval förutsättningar för långsiktigt bevarande och möjligheten att återanvända data.
Ange förväntad volym/storlek (ex. Gigabyte/Terabyte eller antal objekt/filer) för de data som hanteras i projektet. Om projektet hanterar stora volymer data har det i så fall beaktats i budget, vid val av lagringslösning och hur påverkar det förutsättningar för delning/överföring av data.
Se även: Att välja filformat (Svensk nationel datatjänst)
Dokumentation och datakvalitet
Denna del fokuserar på dokumentationen och säkerställande av kvalitet för projektets data.
Ange hur materialet kommer att dokumenteras och beskrivas vad gäller metoder för insamling och analys av data samt struktur, format, standarder, variabler och annan beskrivning av data. Hur säkerställs att andra kan förstå, granska och återanvända data? I vilken utsträckning kommer disciplinspecifika metadatastandarder att användas.
Hur kommer data att organiseras under projektet, ex. rutiner för namngivning av filer, mappstruktur och versionshantering?
Hur kommer kvalitet hos data säkerställas och vilka rutiner finns för dokumentation används för att få data som är kompletta, korrekta och konsekventa (till exempel repeterade mätningar, validering av datainmatning, användning av beskrivande metadata)?
Se även: Arbeta med data (Svensk nationell datatjänst)
Lagring och säkerhetskopiering
I denna del ligger fokus på lagringslösningar, datasäkerhet och rutiner för säkerhetskopiering av data under forskningsprojektets gång.
Beskriv kortfattat valda lagringslösningar för projektets data. Hur säkerställs krav på datasäkerhet, integritet och kontrollerad åtkomst?
Har data informationsklassats och vilka hänsyn har tagits om data innehåller känsliga information som exempelvis personuppgifter?
Om data omfattar personuppgifter, hur kommer individernas identitet att skyddas, t.ex. genom pseudonymisering eller anonymisering?
Se även:
Rättsliga och etiska aspekter
Här ligger fokus på hur data hanteras i enlighet med etiska riktlinjer och rättsregler som bland annat rör skydd av personuppgifter, sekretess och immaterialrätt.
På vilket sätt säkerställs att data hanteras på rätt sätt utifrån juridiska och forskningsetiska aspekter? Krävs en godkänd etikprövning för att påbörja insamling av data?
Hur hanteras ansvar för och rättigheter till data? Det kan gälla upphovsrättsliga och/eller immateriella rättigheter, både för befintliga och nya data som kommer att samlas in/genereras. Vilka är förutsättningarna att publicera data och att fortsätta använda data efter projektets slut?
Har rättigheter och skyldigheter hanterats via avtal om flera parter ingår i projektet?
Om projektet kommer att hantera konfidentiell eller känslig information, hur påverkas förutsättningarna för att lagra, dela och publicera dessa data? Finns behov att skydda vissa uppgifter inför framtida kommersialisering av resultat eller patentansökan?
Se även:
Tillgängliggörande och långtidsbevarande
Denna del fokuserar på hur forskningsdata kan göras öppet tillgänglig och bevaras långsiktigt
Hur kommer data och andra digitala objekt som kod och programvara från projektet att göras tillgängliga? Finns det juridiska, etiska eller andra skäl som begränsar möjligheten att publicera data och tillhörande komponenter.
Behövs särskild programvara, utrustning eller källkod för att kunna ta del av, förstå och återanvända projektets data?
Vid publicering av data, vilka repositorier eller andra plattformar kommer att användas? Under vilken typ av licens kommer data och andra komponenter att publiceras? Hur säkerställs att publicerade data får en permanent identifierare, ex DOI-nummer?
Forskningsdata är en allmän handling vid Uppsala universitet och måste enligt lag även bevaras vid myndigheten. Hur säkerställs långsiktigt bevarande och dokumentation av data så underlaget till publicerade forskningsresultat kan granskas?
Om flera parter är involverade, hur fördelas ansvar för bevarande av data efter projektets slut?
Se även:
- Färdigställa och göra data tillgängliga (Svensk nationell datatjänst)
- Publicera data
- Arkivering och gallring
Ansvar och resurser
I denna del beskrivs vem som ansvarar för olika delar i hanteringen av data och vilka resurser som krävs.
Beskriv roller och ansvarsområden för olika delar i hanteringen av data. Vid projekt med flera parter bör det framgå hur hur ansvaret fördelas.
Vilka resurser som kommer att krävas för att kunna genomföra den planerade datahanteringen och för att data ska uppfylla FAIR-principerna? Det kan gälla ekonomiskt utrymme för lagringslösningar, hårdvara och mjukvara, men även kompetens. Behöver man anlita extern personal eller tjänster, och har projektet i så fall budgeterat för detta?
FAIR-principerna
Vissa mallar för datahanteringsplaner fokuserar på hur projektet ska hantera data så att de uppfyller de så kallade FAIR-principerna - Findable, Accessible, Interoperable and Reusable. Dessa aspekter i datahanteringen kan även beskrivas i avsnitten ovan. Centrala aspekter i FAIR-konceptet är att data ska vara möjliga att hitta (Findable) med information om hur man kan få tillgång till dem (Accessible). Lika viktigt är val av format och standarder för att skapa kompatibilitet (Interoperable) och grundlig dokumentation för att göra data förståeliga och återanvändbara (Reusable).
För att forskningsdata ska uppfylla FAIR-principerna behöver data inte vara öppet tillgängliga, men en beskrivning av datamängden bör vara tillgänglig med uppgift om vilka förutsättningar som finns för att få tillgång till materialet.