Dataanalys: Skapa värde genom data

Dataanalys handlar om att utvinna kunskap ur digitala data. Med tanke på att digitala data finns överallt har Dataanalys ett brett spektrum av tillämpningar, från att stödja vetenskapliga upptäckter inom biovetenskap till att förstå de mekanismer genom vilka desinformation sprids i sociala medier.
Beskrivning
Volymen, variationen och hastigheten som ofta kännetecknar dagens digitala data kräver tillämpning och utveckling av metoder som har sina rötter i flera olika discipliner, t.ex. databaser, distribuerad databehandling, maskininlärning, datautvinning och visualisering. Detta gör Dataanalys till ett tvärvetenskapligt område.
Bearbetning av mycket stora datamängder kräver till exempel effektiv datahantering, vilket leder till att man ofta använder metoder från databaser, artificiell intelligens och molntjänster. Dagens digitala data finns också i en mängd olika former, t.ex. bilder, text och grafer. Detta kräver tillämpning och utveckling av specialiserade algoritmer, exempelvis från bildanalys, naturlig språkbehandling och analys av sociala nätverk. Dessutom varierar data ofta i tid. Därför är dataströmmar och algoritmer för longitudinell och temporal dataanalys ofta viktiga inslag i Dataanalys-tillämpningar.
Inom Dataanalys påverkas tekniska ämnen som datamodeller och algoritmer ofta av etiska och juridiska överväganden. Ett exempel är vår forskning om decentraliserad och integritetsbevarande dataanalys.
Forskningsämnen
- Dataanalys, Integration och Visualisering: datakurering, insamling, analys och integration för intelligenta och autonoma system.
- Databaser: big data, sökordsökning och rankning, (semi)strukturerade data, (attributerade) grafer, semantiska data, spatial data, online (geo)sociala nätverk.
- Distribuerade Databehandlingsinfrastrukturer: effektivitet och optimering av storskaliga beräkningsresurser.
- Federated Machine Learning: federerat lärande, lagringshantering, datakomprimering, säkerhet och integritet, simulering och sampling.
- Lärande, Inferens och Optimering: probabilistisk ML, djupinlärning, robust lärande, Bayesiansk och simuleringsbaserad inferens, inversa problem, statistisk sampling, aktivt lärande, global optimering.
- Nätverksteori: flerskiktsnätverk, temporala textnätverk, probabilistiska nätverk.
- Social Data Science: social nätverksanalys, analys av onlinekommunikation, online desinformation.
Forskningsverksamheter
Forskningsgrupper vid institutionen:
- CPS-Lab – Cyber-physical Systems Lab at Uppsala University
- InfoLab – Uppsala University Information Laboratory
- SciML – Scientific Machine Learning group
- UDBL – Uppsala Database Laboratory
- UppsalaVLL – Uppsala Vision, Language and Learning group
Vi är också en del av eSSENCE, ett strategiskt samarbetsprogram för forskning inom e-vetenskap mellan Uppsala universitet, Lunds universitet och Umeå universitet.
Seniora forskare
- Ece Calikus (InfoLab)
- Georgios Fakas (UDBL)
- Didem Gurdur Broo (ICPS-Lab)
- Andreas Hellander (SciML)
- Matteo Magnani (InfoLab)
- Christian Rohner (InfoLab)
- Prashant Singh (SciML)
- Salman Toor (SciML)
- Ekta Vats (UppsalaVLL)
- Davide Vega D'Aurelio (InfoLab)
Forskningspriser
- Nordic observatory for digital media and information disorder (NORDIS): Chydenius medal.
Utbildning
Kurser i Dataanalys ingår i följande program:
- Masterprogram i dataanalys, inriktning Data engineering
- Masterprogram i dataanalys, inriktning Maskininlärning och statistik
- Masterprogram i Bildanalys och maskininlärning