Beáta Megyesi
Professor i datorlingvistik (tjänstledig) vid Institutionen för lingvistik och filologi
- Telefon:
- 018-471 78 60
- E-post:
- Beata.Megyesi@lingfil.uu.se
- Besöksadress:
- Engelska parken
Thunbergsvägen 3H - Postadress:
- Box 635
751 26 UPPSALA - Tjänstledig:
- 2023-08-01 - 2025-07-31
Ladda ned kontaktuppgifter för Beáta Megyesi vid Institutionen för lingvistik och filologi
- Akademiska meriter:
- FD, docent
- CV:
- Ladda ned CV
- ORCID:
- 0000-0002-4838-6518
Kort presentation
Jag är professor i datorlingvistik och är för närvarande tjänstledig från Uppsala universitet.
Jag är intresserad av automatisk bearbetning och analys av naturliga språk med särskild inriktning mot digital humaniora/filologi. Jag bedriver forskning i historisk kryptologi för att utveckla metoder för att automatiskt knäcka hemligt kodade dokument, s.k. chiffer. Jag utvecklar också verktyg som möjliggör humanister och samhällsvetare att få kvantitativa analyser av sina texter.
Nyckelord
- digital humanities
- historical cryptology
- natural language processing
Biografi
Utbildning
- Professor i datorlingvistik, Institutionen för lingvistik och filologi, Uppsala universitet, 2021
- Docent i datorlingvistik, Institutionen för lingvistik och filologi, Uppsala universitet, 2013
- Fil. dr. i talkommunikation, Institutionen för Tal, musik och hörsel, Kungliga Tekniska Högskolan (KTH), 2002
- Fil. kand. i datorlingvistik, Institutionen för lingvistik, Stockholms universitet, 2000
Uppdrag
Nuvarande:
- Ledamot i Vetenskapsrådets beredningsgrupp för Språkvetenskap, 2021-2023
- Vice-ordförande och ledamot i Centrum för Digital Humaniora, 2021-2023
- Nomineringskommitté för "Northern European Association for Language Technology" – NEALT, 2022-2025
Tidigare:
- President för "Northern European Association for Language Technology" NEALT, 2020-2021
- Prefekt, Inst. för lingvistik och filologi, Uppsala universitet, 2009-2018
- Föreståndare för Engelska parkens campus, Uppsala universitet, 2017-2018
- Vicepresident för Northern European Association for Language Technology - NEALT, 2018-2019
- Lärarrepresentant i institutionsstyrelsen för Inst. för lingvistik och filologi, Uppsala universitet, 2007–2009, 2010-2012, 2012-2015, 2016-2018, 2022-2024
- Ledamot i Språkvetenskapliga fakultetsnämnden, Uppsala universitet, 2008-2011, 2011-2014, 2019-2020
- Studierektor på grund- och avancerad nivå, Inst. för lingvistik och filologi, Uppsala universitet, 2007-2009
- Programsamordnare för Språkteknologiprogrammet, Inst. för lingvistik och filologi, Uppsala universitet 2004-2007
- Representant i institutionsstyrelsen på Tal, musik och hörsel, KTH, 2003-2004
Undervisning
Grundnivå
- Språk, datorer och textbehandling, 7,5 hp: (2011-2020)
- Handledare till kursen Projektarbete i språkteknologi, 7,5 hp: (2011-2019)
- Uppsatshandledning
Avancerad nivå
- Forskning och utveckling, 15 hp (2021-2022)
- Digital filologi, 5 samt 7.5 hp (2018-2023)
- Examensarbeten i språkteknologi, 30 hp
- Handledare på kursen Projekt i språkteknologi, 7,5 hp: 2011-2015
Forskarutbildning
- Jag har varit bihandledare till Eva Pettersson och Mojgan Seraji
Mentorsnätverket:
Jag har varit medlem i mentorsnätverket sedan 2006. Pedagogiska frågor har alltid engagerat mig och jag vill gärna bidra med att hjälpa och stödja yngre lärare i sin lärarroll från smått till stort utifrån enskilda behov. De pedagogiska undervisningsformer som jag använder mest är traditionella föreläsningar, seminarier, labbar och handledning av projekt och uppsatser. Jag undervisar både fristående- och programkurser på Språkteknologiprogrammet på kandidat- och masternivå samt på Språkvetarprogrammet.
Annat jag gillar: tvillingar, resor till fjärran länder, Amnesty International, böcker, cello, lite motion som skidåkning, piloxing och pump, choklad, margaritas och cosmos, ladies of jazz, Broarna i Madison county, mina bästa väninnor som står ut med mig år efter år... och min (ofta tomma) not-to-do lista...
Jag ogillar: girighet, orättvisor och härskartekniker
Forskning
Forskningsintressen
- Historisk kryptologi
- Digital filologi med fokus på automatisk analys av historiska texter och elevtexter
- Ordklasstaggning, morfologisk analys, chunkning, ytsyntaktisk parsning för olika språk
- Parallella korpusar och trädbanker
- Textkategorisering
Projekt jag medverkar/medverkat i:
- DECRYPT: Dekryptering av historiska manuskript (PI, Vetenskapsrådet: 2018-2024).
- DECODE: Automatisk avkodning av historiska manuskript (PI, Vetenskapsrådet: 2015-2017)
- SweLL - L2 infrastruktur: Forskningsinfrastruktur för svenska som andraspråk (RJ, 2017-2019)
- SWE-CLARIN: SWEGRAM: Automatisk annotering och analys av texter på svenska (Vetenskapsrådet, 2014-2018, 2019-2023)
- Flerspråkig parallellkorpus
- Svensk trädbank
- Grammatikextraktion
- Basresurser för svensk språkteknologi

Publikationer
Urval av publikationer
What Was Encoded in Historical Cipher Keys in the Early Modern Era?
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., 2022
Lost in Transcription of Graphic Signs in Ciphers
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022, s. 153-158, 2022
The DECODE Database of Historical Ciphers and Keys: Version 2
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., s. 111-114, 2022
Proceedings of the 5th International Conference on Historical Cryptology
2022
Identifying Cleartext in Historical Ciphers
Ingår i Proceedings of the Workshop on Language Technologies for Historical and Ancient Languages. LT4HALA 2022., 2022
Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
Ingår i Proceedings of the 4th International Conference on Historical Cryptology HistoCrypt 2021, 2021
- DOI för Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
- Ladda ner fulltext (pdf) av Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
Transcription of Historical Ciphers and Keys: Guidelines, version 2.0
2021
Deciphering Papal Ciphers from the 16th to the 18th Century
Ingår i Cryptologia, s. 479-540, 2021
- DOI för Deciphering Papal Ciphers from the 16th to the 18th Century
- Ladda ner fulltext (pdf) av Deciphering Papal Ciphers from the 16th to the 18th Century
Ingår i Proceedings of the 28th International Conference on Computational Linguistics. COLING 2020, s. 357-369, 2020
Proceedings of the 3rd International Conference on Historical Cryptology
2020
- Ladda ner fulltext (pdf) av Proceedings of the 3rd International Conference on Historical Cryptology
Transcription of Historical Ciphers and Keys
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology, s. 106-115, 2020
A Web-based Interactive Transcription Tool for Encrypted Manuscripts
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology HistoCrypt 2020, 2020
- DOI för A Web-based Interactive Transcription Tool for Encrypted Manuscripts
- Ladda ner fulltext (pdf) av A Web-based Interactive Transcription Tool for Encrypted Manuscripts
Decryption of historical manuscripts: the DECRYPT project
Ingår i Cryptologia, s. 545-559, 2020
- DOI för Decryption of historical manuscripts: the DECRYPT project
- Ladda ner fulltext (pdf) av Decryption of historical manuscripts: the DECRYPT project
Pseudonymization of Language Learner Data
Ingår i Workshop om pseudonymisering av textdata, 2019
The SweLL Language Learner Corpus: From Design to Annotation
Ingår i Northern European Journal of Language Technology (NEJLT), s. 67-104, 2019
- DOI för The SweLL Language Learner Corpus: From Design to Annotation
- Ladda ner fulltext (pdf) av The SweLL Language Learner Corpus: From Design to Annotation
Matching Keys and Encrypted Manuscripts
Ingår i Proceedings of the 22nd Nordic Conference on Computational Linguistics (NoDaLiDa '19), 2019
Proceedings of the Workshop on NLP and Pseudonymisation
2019
The DECODE Database: Collection of Historical Ciphers and Keys
Ingår i Proceedings of the 2nd International Conference on Historical Cryptology, s. 69-78, 2019
Towards a Generic Unsupervised Method for Transcription of Encoded Manuscripts
Ingår i Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, 2019
SWEGRAM: Annotering och analys av svenska texter
2019
Ingår i Proceedings of the 7th NLP4CALL, 2018
Proceedings of the 1st International Conference on Historical Cryptology: HistoCrypt 2018
2018
The HistCorp Collection of Historical Corpora and Resources
Ingår i DHN 2018, s. 306-320, 2018
Annotation of learner corpora: first SweLL insights
Ingår i Abstracts of SLTC 2018, s. 86-89, 2018
Annotating Errors in Student Texts: First Experiences and Experiments
Ingår i Proceedings of Joint 6th NLP4CALL and 2nd NLP4LA Nodalida workshop, s. 47-60, 2017
SWEGRAM: A Web-Based Tool for Automatic Annotation and Analysis of Swedish Texts
Ingår i Proceedings of the 21st Nordic Conference on Computational Linguistics, Nodalida 2017., s. 132-141, 2017
Transcription of Encoded Manuscripts with Image Processing Techniques
Ingår i Proceedings of Digital Humanities 2017., 2017
A Friend in Need?: Research agenda for electronic Second Language infrastructure
Ingår i Proceedings of SLTC 2016, 2016
The Uppsala Corpus of Student Writings: Corpus Creation, Annotation, and Analysis
Ingår i LREC 2016, s. 3192-3199, 2016
Proceedings of the 20th Nordic Conference of Computational Linguistics
ACL Anthology, 2015
A Multilingual Evaluation of Three Spelling Normalization Methods for Historical Text
Ingår i Proceedings of the 8th Workshop on Language Technologyfor Cultural Heritage, Social Sciences, and Humanities(LaTeCH), s. 32-41, 2014
Professional language in Swedish clinical text: Linguistic characterization and comparative studies
Ingår i Nordic Journal of Linguistics, s. 297-323, 2014
The Secrets of the Copiale Cipher
Ingår i Research into Freemasonry and Fraternalism, s. 314-324, 2011
Ingår i Proceedings of the NODALIDA 2009 workshop Nordic Perspectives on the CLARIN Infrastructure of Language Resources, s. 1-5, 2009
Ingår i Multilingualism, 2009
Cultivating a Swedish Treebank
Ingår i Resourceful Language Technology, s. 111-120, Acta Universitatis Upsaliensis, 2008
Language Resources and Tools for Swedish: A Survey
Ingår i Proceedings of the Sixth International Language Resources and Evaluation (LREC 2008), 2008
Single Malt or Blended? A Study in Multilingual Parser Optimization
Ingår i Proceedings of the CoNLL Shared Task Session of EMNLP-CoNLL 2007, s. 933-939, 2007
General-Purpose Text Categorization Applied to the Medical Domain.
2007
The Swedish-Turkish Parallel Corpus and Tools for its Creation
Ingår i Proceedings of NoDaLida 2007, 2007
A Study on Automatically Extracted Keywords in Text Categorization
Ingår i Proceedings of International Conference of Association for Computational Linguistics, 2006
Exploring the Prosody-Syntax Interface in Conversations
Ingår i Proceeding of the 15th International Congress of Phonetic Sciences, 2003
Ingår i Proceedings of Fonetik 2002, 2002
Senaste publikationer
Keys with nomenclatures in the early modern Europe
Ingår i Cryptologia, s. 97-139, 2024
- DOI för Keys with nomenclatures in the early modern Europe
- Ladda ner fulltext (pdf) av Keys with nomenclatures in the early modern Europe
What is the Code for the Code?Historical Cryptology Terminology
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
Towards Data-effective Educational Question Generation with Prompt-based Learning
Ingår i Proceedings of 2023 Computing Conference, 2023
2023
Historical Language Models in Cryptanalysis: Case Studies on English and German
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
Alla publikationer
Artiklar i tidskrift
Keys with nomenclatures in the early modern Europe
Ingår i Cryptologia, s. 97-139, 2024
- DOI för Keys with nomenclatures in the early modern Europe
- Ladda ner fulltext (pdf) av Keys with nomenclatures in the early modern Europe
Ingår i Pattern Recognition Letters, s. 43-49, 2022
- DOI för Few shots are all you need: A progressive learning approach for low resource handwritten text recognition
- Ladda ner fulltext (pdf) av Few shots are all you need: A progressive learning approach for low resource handwritten text recognition
Deciphering Papal Ciphers from the 16th to the 18th Century
Ingår i Cryptologia, s. 479-540, 2021
- DOI för Deciphering Papal Ciphers from the 16th to the 18th Century
- Ladda ner fulltext (pdf) av Deciphering Papal Ciphers from the 16th to the 18th Century
Decryption of historical manuscripts: the DECRYPT project
Ingår i Cryptologia, s. 545-559, 2020
- DOI för Decryption of historical manuscripts: the DECRYPT project
- Ladda ner fulltext (pdf) av Decryption of historical manuscripts: the DECRYPT project
The SweLL Language Learner Corpus: From Design to Annotation
Ingår i Northern European Journal of Language Technology (NEJLT), s. 67-104, 2019
- DOI för The SweLL Language Learner Corpus: From Design to Annotation
- Ladda ner fulltext (pdf) av The SweLL Language Learner Corpus: From Design to Annotation
Parallel corpora and Universal Dependencies for Turkic
Ingår i Turkic languages, s. 259-273, 2015
Professional language in Swedish clinical text: Linguistic characterization and comparative studies
Ingår i Nordic Journal of Linguistics, s. 297-323, 2014
Bootstrapping a Persian Dependency Treebank
Ingår i Linguistic Issues in Language Technology, 2012
The Secrets of the Copiale Cipher
Ingår i Research into Freemasonry and Fraternalism, s. 314-324, 2011
Shallow Parsing with PoS Taggers and Linguistic Features.
Ingår i Journal of Machine Learning Research: Special Issue on Shallow Parsing, s. 639-668, 2002
Kapitel i böcker, delar av antologi
Cultivating a Swedish Treebank
Ingår i Resourceful Language Technology. A Festschrift in Honor of Anna Sågvall Hein, s. 111-120, Acta Universitatis Upsaliensis, 2008
Cultivating a Swedish Treebank
Ingår i Resourceful Language Technology, s. 111-120, Acta Universitatis Upsaliensis, 2008
Supporting Research Environment for Less Explored Languages: A Case Study of Swedish and Turkish
Ingår i Resourceful Language Technology, s. 96-110, Uppsala universitet, 2008
Konferensbidrag
What is the Code for the Code?Historical Cryptology Terminology
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
Towards Data-effective Educational Question Generation with Prompt-based Learning
Ingår i Proceedings of 2023 Computing Conference, 2023
Historical Language Models in Cryptanalysis: Case Studies on English and German
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
What Was Encoded in Historical Cipher Keys in the Early Modern Era?
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., 2022
Lost in Transcription of Graphic Signs in Ciphers
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022, s. 153-158, 2022
The DECODE Database of Historical Ciphers and Keys: Version 2
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., s. 111-114, 2022
Identifying Cleartext in Historical Ciphers
Ingår i Proceedings of the Workshop on Language Technologies for Historical and Ancient Languages. LT4HALA 2022., 2022
Key Design in the Early Modern Era in Europe
Ingår i Proceedings of the 4th International Conference on Historical Cryptology (HistoCrypt 2021), 2021
- DOI för Key Design in the Early Modern Era in Europe
- Ladda ner fulltext (pdf) av Key Design in the Early Modern Era in Europe
Revealing Secrets from the Past: Studying Historical Ciphers.
2021
Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
Ingår i Proceedings of the 4th International Conference on Historical Cryptology HistoCrypt 2021, 2021
- DOI för Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
- Ladda ner fulltext (pdf) av Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
Ingår i Proceedings of the 28th International Conference on Computational Linguistics. COLING 2020, s. 357-369, 2020
Transcription of Historical Ciphers and Keys
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology, s. 106-115, 2020
A Web-based Interactive Transcription Tool for Encrypted Manuscripts
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology HistoCrypt 2020, 2020
- DOI för A Web-based Interactive Transcription Tool for Encrypted Manuscripts
- Ladda ner fulltext (pdf) av A Web-based Interactive Transcription Tool for Encrypted Manuscripts
Automatic Key Structure Extraction
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology, s. 146-152, 2020
Pseudonymization of Language Learner Data
Ingår i Workshop om pseudonymisering av textdata, 2019
Matching Keys and Encrypted Manuscripts
Ingår i Proceedings of the 22nd Nordic Conference on Computational Linguistics (NoDaLiDa '19), 2019
The DECODE Database: Collection of Historical Ciphers and Keys
Ingår i Proceedings of the 2nd International Conference on Historical Cryptology, s. 69-78, 2019
Towards a Generic Unsupervised Method for Transcription of Encoded Manuscripts
Ingår i Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, 2019
Ingår i Proceedings of the 7th NLP4CALL, 2018
The HistCorp Collection of Historical Corpora and Resources
Ingår i DHN 2018, s. 306-320, 2018
Annotation of learner corpora: first SweLL insights
Ingår i Abstracts of SLTC 2018, s. 86-89, 2018
Annotating Errors in Student Texts: First Experiences and Experiments
Ingår i Proceedings of Joint 6th NLP4CALL and 2nd NLP4LA Nodalida workshop, s. 47-60, 2017
SWEGRAM: A Web-Based Tool for Automatic Annotation and Analysis of Swedish Texts
Ingår i Proceedings of the 21st Nordic Conference on Computational Linguistics, Nodalida 2017., s. 132-141, 2017
Transcription of Encoded Manuscripts with Image Processing Techniques
Ingår i Proceedings of Digital Humanities 2017., 2017
Swe-Clarin: Language Resources and Technology for Digital Humanities
Ingår i Digital Humanities 2016, s. 29-51, 2016
A Friend in Need?: Research agenda for electronic Second Language infrastructure
Ingår i Proceedings of SLTC 2016, 2016
The Uppsala Corpus of Student Writings: Corpus Creation, Annotation, and Analysis
Ingår i LREC 2016, s. 3192-3199, 2016
Ranking Relevant Verb Phrases Extracted from Historical Text
Ingår i Proceedings of the 9th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, 2015
A Multilingual Evaluation of Three Spelling Normalization Methods for Historical Text
Ingår i Proceedings of the 8th Workshop on Language Technologyfor Cultural Heritage, Social Sciences, and Humanities(LaTeCH), s. 32-41, 2014
Verb Phrase Extraction in a Historical Context
2014
Automatic Morphosyntactic Analaysis of Clinical Text
2014
A Multilingual Evaluation of Three Spelling Normalization Methods for Historical Text.
Ingår i Workshop on Language Technology for Cultural Heritage, Social Sciences and Humanities, LaTeCH 2014, 2014
EACL - Expansion of Abbreviations in CLinical text
Ingår i Workshop on Predicting and Improving Text Readability for Target Reader Populations, PITR 2014, 2014
Ingår i Proceedings of the 19th Nordic Conference on Computational Linguistics, 2013
An SMT Approach to Automatic Annotation of Historical Texts
Ingår i Workshop on Computational Historical Linguistics, Nodalida 2013., 2013
A Basic Language Resource Kit for Persian
Ingår i Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), s. 2245-2252, 2012
Rule-Based Normalisation of Historical Text – a Diachronic Study
Ingår i Empirical Methods in Natural Language Processing, s. 333-341, 2012
Parsing the Past - Identification of Verb Constructions in Historical Text
Ingår i Language Technology for Cultural Heritage, Social Sciences, and Humanities, 2012
Dependency Parsers for Persian
Ingår i Proceedings of 10th Workshop on Asian Language Resources, COLING 2012, 24th International Conference on Computational Linguistics, Mumbai, India, 2012
2011
Using Parallel Corpora in Data-Driven Teaching of Turkish in Sweden.
s. 1686-1689, 2010
The English-Swedish-Turkish Parallel Treebank
Ingår i Proceedings of Language Resources and Evaluation (LREC 2010), 2010
Ingår i Proceedings of the NODALIDA 2009 workshop Nordic Perspectives on the CLARIN Infrastructure of Language Resources, s. 1-5, 2009
The Open Source Tagger HunPoS for Swedish.
Ingår i Proceedings of the 17th Nordic Conference on Computational Linguistics (NODALIDA), 2009
Ingår i Multilingualism, 2009
Swedish-Turkish Parallel Treebank
Ingår i Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), 2008
Language Resources and Tools for Swedish: A Survey
Ingår i Proceedings of the Sixth International Language Resources and Evaluation (LREC 2008), 2008
Single Malt or Blended? A Study in Multilingual Parser Optimization
Ingår i Proceedings of the CoNLL Shared Task Session of EMNLP-CoNLL 2007, s. 933-939, 2007
Single Malt or Blended? A Study in Multilingual Parser Optimization.
Ingår i Proceedings of the CoNLL Shared Task Session of EMNLP-CoNLL 2007, 2007
Bootstrapping a Swedish Treebank Using Cross-Corpus Harmonization and Annotation Projection.
Ingår i Proceedings of Treebanks and Linguistic Theories, 2007
The Swedish-Turkish Parallel Corpus and Tools for its Creation
Ingår i Proceedings of NoDaLida 2007, 2007
Bootstrapping a Swedish Treebank Using Cross-Corpus Harmonization and Annotation Projection
Ingår i Proceedings of the 6th International Workshop on Treebanks and Linguistic Theories, s. 97-102, 2007
A Study on Automatically Extracted Keywords in Text Categorization
Ingår i Proceedings of International Conference of Association for Computational Linguistics, 2006
Building a Swedish-Turkish Parallel Corpus
Ingår i Proceedings of Language Resources and Evaluation Conference, 2006
Using Linguistic Data for Genre Classification
Ingår i Proceedings of SAIS-SSLS, 2005
The Acoustic and Morpho-Syntactic Context of Prosodic Boundaries in Dialogs.
Ingår i Proceedings of Fonetik 2003, 2003
Exploring the Prosody-Syntax Interface in Conversations
Ingår i Proceeding of the 15th International Congress of Phonetic Sciences, 2003
Ingår i Proceedings of Fonetik 2002, 2002
Ingår i Proceedings of ICSLP'2002 - 7th International Conference on Spoken Language Processing, 2002
Data-Driven Methods for Building a Swedish Treebank.
Ingår i Swedish Treebank Symposium, 2002
Silence and Discourse Context in Read Speech and Dialogues in Swedish
Ingår i Proceedings of the Speech Prosody 2002 conference, s. 363-366, 2002
Comparing Data-Driven Learning Algorithms for PoS Tagging of Swedish
Ingår i Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2001), 2001
Pausing in Dialogues and Read Speech: Speaker's Production and Listeners Interpretation
Ingår i Proceedings of the Workshop on Prosody in Speech Recognition and Understanding, 2001
A Comparative Study of Pauses in Dialogues and Read Speech.
Ingår i Proceedings of Eurospeech 2001, s. 931-935, 2001
Data-Driven Methods for PoS tagging and Chunking of Swedish
Ingår i In the Proceedings of the Nordic Conference on Computational Linguistics, Nodalida 2001, 2001
Phrasal Parsing by Using Data-Driven PoS Taggers
Ingår i Proceedings of the Conference on Recent Advances in Natural Language Processing, s. 166-173, 2001
Ensemble of Classifiers for Noise Detection in PoS Tagged Corpora
Ingår i Proceedings of the Third International Workshop on TEXT, SPEECH and DIALOGUE, s. 27-32, 2000
Towards a Finite-State Parser for Swedish
Ingår i Proceedings of NoDaLiDa 99, s. 115-123, 2000
Improving Brill's PoS Tagger for an Agglutinative Language
Ingår i Proceedings of the Joint Sigdat Conference on Empirical Methods in Natural Language Processing and Very Large Corpora, s. 275-284, 1999
Brill's PoS Tagger with Extended Lexical Templates for Hungarian
Ingår i Proceedings of the Workshop (W01) on Machine Learning in Human Language Technology, s. 22-28, 1999
Proceedings (redaktörskap)
2023
Proceedings of the 5th International Conference on Historical Cryptology
2022
Proceedings of the 3rd International Conference on Historical Cryptology
2020
- Ladda ner fulltext (pdf) av Proceedings of the 3rd International Conference on Historical Cryptology
Proceedings of the Workshop on NLP and Pseudonymisation
2019
Proceedings of the 1st International Conference on Historical Cryptology: HistoCrypt 2018
2018
Rapporter
SweLL transcription guidelines, L2 essays
2021
SweLL Pseudonymization Guidelines
2021
Transcription of Historical Ciphers and Keys: Guidelines, version 2.0
2021
Transcription of Historical Ciphers and Keys: Guidelines
2020
SWEGRAM: Annotering och analys av svenska texter
2019
Survey on Swedish Language Resources
2008
The Open Source Tagger HunPoS for Swedish
2008
Supporting Research Environment for Swedish and Turkish
2008
Converting SUC2.0 to XCES with stand-off annotation
2007
Changing the tokenization in Talbanken to SUC2.0
2007
General-Purpose Text Categorization Applied to the Medical Domain.
2007
Samlingsverk (redaktörskap)
Proceedings of the 20th Nordic Conference of Computational Linguistics
ACL Anthology, 2015
Resourceful Language Technology: Festschrift in Honor of Anna Sågvall Hein
Acta Universitatis Upsaliensis, 2008