Carl Nettelblad
Universitetslektor vid Institutionen för informationsteknologi; Beräkningsvetenskap
- Telefon:
- 018-471 22 68
- Mobiltelefon:
- 070-359 12 42
- E-post:
- carl.nettelblad@it.uu.se
- Besöksadress:
- Hus 10, Lägerhyddsvägen 1
- Postadress:
- Box 337
751 05 UPPSALA
Teknisk koordinator vid Institutionen för informationsteknologi; UPPMAX, Uppsala Multidisciplinary Centre for Advanced Computational Science
- Mobiltelefon:
- 070-359 12 42
- E-post:
- carl.nettelblad@uppmax.uu.se
- Besöksadress:
- Hus 10, Lägerhyddsvägen 1
- Postadress:
- Box 337
751 05 Uppsala
- Akademiska meriter:
- Docent
- ORCID:
- 0000-0003-0458-6902
Mer information visas för dig som medarbetare om du loggar in.
Kort presentation
Forskar inom beräkningsvetenskap, inriktat på att använda moderna datorarkitekturer (GPU, massiv parallellism) inom olika typer av dataanalys i livsvetenskaperna. En grundfrågeställning är "hur kan vi ha bättre beräkningsmetoder för att ge säkrare analyser från sämre data".
Nyckelord
- artificial intelligence
- genomics
- hidden markov models
- hpc
- machine learning
- optimization
- xfel
Biografi
Enorma framsteg har skett i metoder för massiv datainsamling inom biologi. Teknikutvecklingen har möjliggjort större och större datamängder, som snabbt passerat så stora att det inte finns någon som helst möjlighet för en enskild forskare att kontrollera om resultat är rimliga. Därför blir det viktigare att analysmetoder automatiskt kan identifiera och hantera fel.
Utgångspunkten för min forskning är att data alltid kommer att innehålla fel, ofullständigheter och brus. Med den utgångspunkten kan man analysera "dåliga" prover, eller ta med en större del av materialet. Det mer vedertagna sättet i dag är att filtrera ut de delar som håller högst kvalitet och i stället fokusera analysen på dem, eller att använda metoder utformade för säkra prover och bara hoppas att de ger rätt resultat även när delar av labbresultatet är mer osäkert.
I dagsläget fokuserar jag på samarbeten inom enkelpartikelavbildning med röntgenlaser, respektive modellering av haplotypstruktur och fasning av genomikdata vid låg täckning/hög felfrekvens. Jag är ändå hela tiden nyfiken på nya tillämpningar där statistisk modellering och massiva beräkningar kan vara relevant.
Som kuriosa kan nämnas att jag längre tillbaka har deltagit och vunnit medaljer i olika internationella vetenskapstävlingar, som IMO (matematik), IOI (programmering), IBO (biologi) och ACM ICPC (programmering).
Är du som student intresserad av ett projekt med inriktning mot dataanalys och högprestandaberäkningar på kandidatnivå, masternivå eller som doktorand/postdoc? Hör av dig. Projekt kan anpassas till dina förkunskaper. I dagsläget är vi väldigt intresserade av att mer explorativt utveckla testa andra arkitekturer för neurala nätverk för genomikdata (transfomers, diffusionsmodeller för att ta två exempel).
Publikationer
Urval av publikationer
- Achieving improved accuracy for imputation of ancient DNA (2023)
- A deep learning framework for characterization of genotype data (2022)
- A joint use of pooling and imputation for genotyping SNPs (2022)
- Hummingbird (2016)
- Coherent diffraction of single Rice Dwarf virus particles using hard X-rays at the Linac Coherent Light Source (2016)
- Three-dimensional reconstruction of the giant mimivirus particle with an X-ray free-electron laser (2015)
- Imputation of single nucleotide polymorphism genotypes in biparental, backcross, and topcross populations with a hidden Markov model (2015)
- Breakdown of methods for phasing and imputation in the presence of double genotype sharing (2013)
- Fast and accurate detection of multiple quantitative trait loci (2013)
- Inferring haplotypes and parental genotypes in larger full sib-ships and other pedigrees with missing or erroneous genotype data (2012)
- cnF2freq (2009)
Senaste publikationer
- Genotyping of SNPs in bread wheat at reduced cost from pooled experiments and imputation (2024)
- Observation of a single protein by ultrafast X-ray diffraction (2024)
- Data-Driven Locality-Aware Batch Scheduling (2024)
- Project Hephaistos – II. Dyson sphere candidates from Gaia DR3, 2MASS, and WISE (2024)
- Achieving improved accuracy for imputation of ancient DNA (2023)
Alla publikationer
Artiklar
- Genotyping of SNPs in bread wheat at reduced cost from pooled experiments and imputation (2024)
- Observation of a single protein by ultrafast X-ray diffraction (2024)
- Project Hephaistos – II. Dyson sphere candidates from Gaia DR3, 2MASS, and WISE (2024)
- Achieving improved accuracy for imputation of ancient DNA (2023)
- A deep learning framework for characterization of genotype data (2022)
- An empirical evaluation of genotype imputation of ancient DNA (2022)
- A joint use of pooling and imputation for genotyping SNPs (2022)
- Ptychographic wavefront characterization for single-particle imaging at x-ray lasers (2021)
- Training algorithm matters for the performance of neural network potential (2021)
- Diffraction data from aerosolized Coliphage PR772 virus particles imaged with the Linac Coherent Light Source (2020)
- Flash X-ray diffraction imaging in 3D (2020)
- Electrospray sample injection for single-particle imaging with x-ray lasers (2019)
- The presence and impact of reference bias on population genomic studies of prehistoric human populations (2019)
- BAMSI (2018)
- Femtosecond X-ray Fourier holography imaging of free-flying nanoparticles (2018)
- Assessing uncertainties in x-ray single-particle three-dimensional reconstruction (2018)
- Considerations for three-dimensional image reconstruction from experimental data in coherent diffractive imaging (2018)
- A statistical approach to detect protein complexes at X-ray free electron laser facilities (2018)
- Using convex optimization of autocorrelation with constrained support and windowing for improved phase retrieval accuracy (2018)
- A hybrid method for the imputation of genomic data in livestock populations (2017)
- Experimental strategies for imaging bioparticles with femtosecond hard X-ray pulses (2017)
- Correlations in scattered X-ray laser pulses reveal nanoscale structural features of viruses (2017)
- A flexible computational framework using R and Map-Reduce for permutation tests of massive genetic analysis of complex traits (2017)
- Artifact reduction in the CSPAD detectors used for LCLS experiments (2017)
- Coherent soft X-ray diffraction imaging of Coliphage PR772 at the Linac coherent light source (2017)
- Hummingbird (2016)
- QTL as a service (2016)
- Coherent diffraction of single Rice Dwarf virus particles using hard X-rays at the Linac Coherent Light Source (2016)
- Three-dimensional reconstruction of the giant mimivirus particle with an X-ray free-electron laser (2015)
- Imputation of single nucleotide polymorphism genotypes in biparental, backcross, and topcross populations with a hidden Markov model (2015)
- MAPfastR (2013)
- Breakdown of methods for phasing and imputation in the presence of double genotype sharing (2013)
- Fast and accurate detection of multiple quantitative trait loci (2013)
- Inferring haplotypes and parental genotypes in larger full sib-ships and other pedigrees with missing or erroneous genotype data (2012)
- Coherent estimates of genetic effects with missing information (2012)
- An improved method for estimating chromosomal line origin in QTL analysis of crosses between outbred lines (2011)
- Using feedback in pooled experiments augmented with imputation for high genotyping accuracy at reduced cost
Böcker
- Two Optimization Problems in Genetics (2012)
- Using Markov models and a stochastic Lipschitz condition for genetic analyses (2010)
Konferenser
- Data-Driven Locality-Aware Batch Scheduling (2024)
- Bootstrapping Weakly Supervised Segmentation-free Word Spotting through HMM-based Alignment (2020)
- Feature evaluation for handwritten character recognition with regressive and generative Hidden Markov Models (2016)
- Haplotype inference based on hidden Markov models in the QTL–MAS 2010 multigenerational dataset (2011)
- A Grid-Enabled Problem Solving Environment for QTL Analysis in R (2010)
- cnF2freq (2009)
Rapporter
- Consistency Study of a Reconstructed Genotype Probability Distribution via Clustered Bootstrapping in NORB Pooling Blocks (2022)
- Breakdown of methods for phasing and imputation in the presence of double genotype sharing (2012)
- Inferring haplotypes and parental genotypes in larger full sib-ships and other pedigrees with missing or erroneous genotype data (2012)
- Assessing orthogonality and statistical properties of linear regression methods for interval mapping with partial information (2010)
- Stochastically Guaranteed Global Optimums Achievable with a Divide-and-Conquer Approach to Multidimensional QTL Searches (2010)