Skapa, samla in och återanvända data
Data samlas in och genereras på en mängd olika sätt i forskningen och kompetensen när det gäller val av metod och verktyg finns främst hos forskarkollektivet. Nedan finns information om några områden som forskningsdatastödet ofta får frågor om.
Ibland kan befintliga datamängder återanvändas, antingen som huvudsaklig datakälla eller som komplement till egna insamlade data. Dessa data kan komma från olika registerhållare eller finnas öppet tillgängliga via datarepositorier. Vid återanvändning av data är det viktigt att kontrollera användningsvillkor och licenser. Godkänd etikprövning kan behövas för utlämning av vissa datamängder.
Datarepositorier och kataloger
Det finns en mängd repositorier och kataloger källor där data publiceras. I de flesta fall är data direkt tillgängliga för nedladdning, men i vissa fall krävs en ansökan om att få tillgång till materialet.
Exempel på generella, ämnesövergripande datarepositorier:
- Zenodo - repositorium som drivs av OpenAIRE och CERN med finansiering från EU-kommissionen. Kan användas för publicering av data, programkod och publikationer.
- Figshare - datarepositorium som företaget Digital Science står bakom.
- Dryad - repositorium som drivs av ett nätverk av lärosäten, vetenskapliga sällskap och förlag.
Exempel på ämnesspecifika repositorier:
- CESSDA – samhällsvetenskap.
- DARIAH – humaniora.
- ELIXIRs list of deposition databases for biomolecular data - life science
- FEGA Sweden – repositorium med kontrollerad delning av genomikdata.
- HEPData – högenergifysik.
- NOMAD – materialvetenskap.
- PANGAEA – geo- och biovetenskap.
- Swedish Biodiversity Data Infrastructure – biologisk mångfald.
- SciLifeLab Data Repository – livsvetenskap.
För att hitta andra datarepositorier kan du söka här:
- re3data - Registry of Research Data Repositories.
Se också handledningen över hur man söker i re3data från Bath University Library. - FAIRsharing databases, University of Oxford.
- Core Certified Repositories. En lista över repositorier som är certifierade enligt Core Trust Seals krav.
Du kan också söka data som samlats från mängder av leverantörer i dataportaler, såsom:
- Researchdata.se - nationell portal för forskningsdata publicerade vid svenska lärosäten, forskningsinfrastrukturer och andra forskningsorganisationer.
- OpenAIRE Explore - öppet tillgängligt material från studier finansierade av EU-kommissionen.
- Data.europa.eu -öppna data från europeiska institutioner och organisationer.
- Dataportal.se - data från svenska organisationer och myndigheter.
- DataCite - dataset som har tilldelats DOI, oavsett ämne och ursprung.
- Google Dataset Search
Det är även möjligt att söka efter dataset i bibliografiska databaser som Uppsala universitetsbiblioteks söktjänst, Web of Science eller Dimensions.
Enkätverktyg
Enkätverktyg som erbjuds via Uppsala universitet.
- Kurt – ett webbaserat formulärsystem som är kostnadsfritt att använda för alla vid Uppsala universitet. Används för att skapa och administrera enkäter och anmälningar. Data lagras vid servrar på universitetet. KRT-värde: 221
- Mentimeter – kan användas för interaktiva omröstningar eller för att samla in anonyma kommentarer som visas i realtid. Data lagras utanför universitetet och vissa data kan även lagras utanför EU/EEA. Undvik därför frågor som uppmuntrar till svar som kan innehålla känsliga personuppgifter. KRT-värde: 221
- REDCap – ett verktyg för att skapa och hantera enkäter och formulär med fokus på att samla in och analysera kliniska data i forskningsprojekt. Kontakta REDCap användarsupport vid UCR via itsupport@uu.se för frågor om tillämpning och regelverk. Data lagras vid Uppsala universitet och verktyget kan användas för känsliga personuppgifter. KRT-värde: 321
- Survey&Report – ett webbaserat avancerat enkätverktyg upphandlat av Sunet (Swedish University computer Network). Svarsdata och personuppgifter lagras externt på leverantören Artisans servrar. Undvik därför frågor som uppmuntrar till svar som kan innehålla känsliga personuppgifter. KRT-värde: 221
Vid användning av externa verktyg för enkäter bör ett personuppgiftsbiträdesavtal tecknas med ansvarig aktör.
Intervjudata
Forskningsdata som innehåller personuppgifter ska hanteras i enlighet med Dataskyddsförordningen och annan relevant svensk lagstiftning. En persons ansikte eller röst som inte förvrängts, kan användas för att identifiera personen och är därmed en personuppgift.
För intervjuer som genomförs digitalt och där konfidentiella uppgifter kan förekomma rekommenderar UU att du genomför dina intervjuer i form av end-to-end-krypterade Zoom-sessioner. En förutsättning i sammanhanget är att de som du intervjuar har en Zoom-klient installerad på dator eller mobil. Om det handlar om personer utanför universitetsmiljön kan de hämta klienten här.
Om intervjuer där konfidentiell information kan förekomma sker på plats rekommenderar universitetet användning av diktafon. Överföring av de inspelade ljudfilerna från diktafon till en säker lagringslösning ska ske så snabbt som möjligt.
Mjukvara för kostnadsfri transkribering av ljud och film finns tillgänglig för vid UU genom tjänsten Whisper. Forskare vid UU kan använda Whisper genom att söka ett projekt på UPPMAX och inom det projektet använda Whisper på plattformarna Bianca (NAISS SENS) eller Snowy. Även ljudfiler med känslig information kan transkriberas om Whisper används på Bianca. Här finns en guide för att använda Whisper hos UPPMAX. Vid behov av stöd kontakta UPPMAX.
Det finns också möjlighet att själv som forskare köpa tjänsten Sunet Tal-till-text direkt från företaget Amberscript förutsatt att man även tecknar ett personuppgiftsbiträdesavtal (PUBA) med dem.
Kammarkollegiet har upphandlat och skrivit ramavtal för manuell transkribering. Om du vill använda tjänsterna, kontakta säkerhetsavdelningen och juridiska avdelningen för avtalsrelaterade frågor för bedömning i varje enskilt ärende.
En lösning kan också vara att tillfälligt anställa en transkriberare i projektet.
Om data inte innehåller känsliga personuppgifter kan du använda transkriberingstjänsten Canvas Studio. Det går mao bra att använda tjänsten för icke-känslig persondata, all data som är klassad med högst 222. Du hittar instruktioner för Canvas här.
I Svensk nationell datatjänsts guide för god hantering av digitalt ljud kan du läsa om hur du långtidsbevarar ljudfiler för att bibehålla datas kvalitet över tid.
Registerdata
På Vetenskapsrådets Registerforskning.se hittar du information om olika register, hur data begärs ut och vilken lagstiftning som gäller. För att kunna forska på registerdata behövs godkänd etikprövningsansökan (EPM) och tillstånd från den myndighet eller organisation som äger källdata.
Vetenskapsrådets verktyg Register Utiliser Tool (RUT) innehåller detaljerad information om de ingående registren och variablerna, men inga faktiska data, mikrodata. Med hjälp av RUT kan du skapa en förteckning över variabler som är relevanta för din forskningsfråga och som kan utgöra en del av ett underlag för både etisk prövning och för att begära ut data.
Via Registerservice, Socialstyrelsens servicefunktion, kan du få hjälp med att beställa statistik eller individuppgifter. Här finns också en förteckning över alla register.
Nationella Kvalitetsregister, Kvalitetsregister.se. Här kan du söka bland alla nationella kvalitetsregister (ca 100 stycken) och få information om registren.
Några andra resurser och källor:
- Statistikmyndigheten, SCB
- Biobank Sverige och publikationer från Biobank Sverige
- Kvalitetsregistercenter Stockholm
- Svenska tvillingregistret
Patientdata
Forskningshuvudmannen är den fysiska eller juridiska person i vars verksamhet forskningen utförs, till exempel lärosäte, kommun eller region. Om man i ett forskningsprojekt exempelvis samlar prover och uppgifter inom sjukvården medan fortsatt bearbetning och analyser görs inom lärosätet så bedömer man normalt att forskningen har två huvudmän, vilket anges i etikansökan. Forskningshuvudmän är också personuppgiftsansvariga och ansvarsfördelningen måste göras tydlig. Ett särskilt avtal för detta kan behöva upprättas.
Överföring av data från hälso- och sjukvården till Uppsala universitet för forskningsändamål sker vanligtvis efter begäran och ett formellt belsut om utlämning av data. Uppsala universitet övertar ansvaret för data som tas emot. Ett personuppgiftsbiträdesavtal (PuBA) upprättas som reglerar vad Uppsala universitet får göra eller inte med data som tas emot.
Information om hur du beställer data för forskning från Region Uppsala hittar du på Samverkanswebben. Här finns även beskrivningar av de olika it-vårdsystemen inom Region Uppsala som du kan beställa data från och vilka villkor som gäller.
Sekvensdata med känslig information går att hitta i repositorier som European Genome-Phenome Archive, liksom i allmänna och disciplinspecifika repositorier, som nämnts ovan.
Läs mer om infrastruktur och resurser vid Uppsala universitet