Beáta Megyesi
Professor i datorlingvistik vid Institutionen för lingvistik och filologi
- Telefon:
- 018-471 78 60
- E-post:
- Beata.Megyesi@lingfil.uu.se
- Besöksadress:
- Engelska parken
Thunbergsvägen 3H - Postadress:
- Box 635
751 26 UPPSALA
Ladda ned kontaktuppgifter för Beáta Megyesi vid Institutionen för lingvistik och filologi
- Akademiska meriter:
- FD, docent
- CV:
- Ladda ned CV
- ORCID:
- 0000-0002-4838-6518
Kort presentation
Jag är professor i datorlingvistik och är för närvarande tjänstledig från Uppsala universitet.
Jag är intresserad av automatisk bearbetning och analys av naturliga språk med särskild inriktning mot digital humaniora/filologi. Jag bedriver forskning i historisk kryptologi för att utveckla metoder för att automatiskt knäcka hemligt kodade dokument, s.k. chiffer. Jag utvecklar också verktyg som möjliggör humanister och samhällsvetare att få kvantitativa analyser av sina texter.
Nyckelord
- digital humanities
- historical cryptology
- natural language processing
Biografi
Utbildning
- Professor i datorlingvistik, Institutionen för lingvistik och filologi, Uppsala universitet, 2021
- Docent i datorlingvistik, Institutionen för lingvistik och filologi, Uppsala universitet, 2013
- Fil. dr. i talkommunikation, Institutionen för Tal, musik och hörsel, Kungliga Tekniska Högskolan (KTH), 2002
- Fil. kand. i datorlingvistik, Institutionen för lingvistik, Stockholms universitet, 2000
Uppdrag
Nuvarande:
- Ledamot i Vetenskapsrådets beredningsgrupp för Språkvetenskap, 2021-2023
- Vice-ordförande och ledamot i Centrum för Digital Humaniora, 2021-2023
- Nomineringskommitté för "Northern European Association for Language Technology" – NEALT, 2022-2025
Tidigare:
- President för "Northern European Association for Language Technology" NEALT, 2020-2021
- Prefekt, Inst. för lingvistik och filologi, Uppsala universitet, 2009-2018
- Föreståndare för Engelska parkens campus, Uppsala universitet, 2017-2018
- Vicepresident för Northern European Association for Language Technology - NEALT, 2018-2019
- Lärarrepresentant i institutionsstyrelsen för Inst. för lingvistik och filologi, Uppsala universitet, 2007–2009, 2010-2012, 2012-2015, 2016-2018, 2022-2024
- Ledamot i Språkvetenskapliga fakultetsnämnden, Uppsala universitet, 2008-2011, 2011-2014, 2019-2020
- Studierektor på grund- och avancerad nivå, Inst. för lingvistik och filologi, Uppsala universitet, 2007-2009
- Programsamordnare för Språkteknologiprogrammet, Inst. för lingvistik och filologi, Uppsala universitet 2004-2007
- Representant i institutionsstyrelsen på Tal, musik och hörsel, KTH, 2003-2004
Undervisning
Grundnivå
- Språk, datorer och textbehandling, 7,5 hp: (2011-2020)
- Handledare till kursen Projektarbete i språkteknologi, 7,5 hp: (2011-2019)
- Uppsatshandledning
Avancerad nivå
- Forskning och utveckling, 15 hp (2021-2022)
- Digital filologi, 5 samt 7.5 hp (2018-2023)
- Examensarbeten i språkteknologi, 30 hp
- Handledare på kursen Projekt i språkteknologi, 7,5 hp: 2011-2015
Forskarutbildning
- Jag har varit bihandledare till Eva Pettersson och Mojgan Seraji
Mentorsnätverket:
Jag har varit medlem i mentorsnätverket sedan 2006. Pedagogiska frågor har alltid engagerat mig och jag vill gärna bidra med att hjälpa och stödja yngre lärare i sin lärarroll från smått till stort utifrån enskilda behov. De pedagogiska undervisningsformer som jag använder mest är traditionella föreläsningar, seminarier, labbar och handledning av projekt och uppsatser. Jag undervisar både fristående- och programkurser på Språkteknologiprogrammet på kandidat- och masternivå samt på Språkvetarprogrammet.
Annat jag gillar: tvillingar, resor till fjärran länder, Amnesty International, böcker, cello, lite motion som skidåkning, piloxing och pump, choklad, margaritas och cosmos, ladies of jazz, Broarna i Madison county, mina bästa väninnor som står ut med mig år efter år... och min (ofta tomma) not-to-do lista...
Jag ogillar: girighet, orättvisor och härskartekniker
Forskning
Forskningsintressen
- Historisk kryptologi
- Digital filologi med fokus på automatisk analys av historiska texter och elevtexter
- Ordklasstaggning, morfologisk analys, chunkning, ytsyntaktisk parsning för olika språk
- Parallella korpusar och trädbanker
- Textkategorisering
Projekt jag medverkar/medverkat i:
- DECRYPT: Dekryptering av historiska manuskript (PI, Vetenskapsrådet: 2018-2024).
- DECODE: Automatisk avkodning av historiska manuskript (PI, Vetenskapsrådet: 2015-2017)
- SweLL - L2 infrastruktur: Forskningsinfrastruktur för svenska som andraspråk (RJ, 2017-2019)
- SWE-CLARIN: SWEGRAM: Automatisk annotering och analys av texter på svenska (Vetenskapsrådet, 2014-2018, 2019-2023)
- Flerspråkig parallellkorpus
- Svensk trädbank
- Grammatikextraktion
- Basresurser för svensk språkteknologi

Publikationer
Urval av publikationer
-
The DECODE Database of Historical Ciphers and Keys: Version 2
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., s. 111-114, 2022
-
Lost in Transcription of Graphic Signs in Ciphers
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022, s. 153-158, 2022
-
Identifying Cleartext in Historical Ciphers
Ingår i Proceedings of the Workshop on Language Technologies for Historical and Ancient Languages. LT4HALA 2022., 2022
-
Proceedings of the 5th International Conference on Historical Cryptology
2022
-
What Was Encoded in Historical Cipher Keys in the Early Modern Era?
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., 2022
-
Transcription of Historical Ciphers and Keys: Guidelines, version 2.0
2021
-
Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
Ingår i Proceedings of the 4th International Conference on Historical Cryptology HistoCrypt 2021, 2021
- DOI för Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
- Ladda ner fulltext (pdf) av Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
-
Deciphering Papal Ciphers from the 16th to the 18th Century
Ingår i Cryptologia, s. 479-540, 2021
- DOI för Deciphering Papal Ciphers from the 16th to the 18th Century
- Ladda ner fulltext (pdf) av Deciphering Papal Ciphers from the 16th to the 18th Century
-
Ingår i Proceedings of the 28th International Conference on Computational Linguistics. COLING 2020, s. 357-369, 2020
-
Transcription of Historical Ciphers and Keys
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology, s. 106-115, 2020
-
Decryption of historical manuscripts: the DECRYPT project
Ingår i Cryptologia, s. 545-559, 2020
- DOI för Decryption of historical manuscripts: the DECRYPT project
- Ladda ner fulltext (pdf) av Decryption of historical manuscripts: the DECRYPT project
-
A Web-based Interactive Transcription Tool for Encrypted Manuscripts
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology HistoCrypt 2020, 2020
- DOI för A Web-based Interactive Transcription Tool for Encrypted Manuscripts
- Ladda ner fulltext (pdf) av A Web-based Interactive Transcription Tool for Encrypted Manuscripts
-
Proceedings of the 3rd International Conference on Historical Cryptology
2020
- Ladda ner fulltext (pdf) av Proceedings of the 3rd International Conference on Historical Cryptology
-
Proceedings of the Workshop on NLP and Pseudonymisation
2019
-
Matching Keys and Encrypted Manuscripts
Ingår i Proceedings of the 22nd Nordic Conference on Computational Linguistics (NoDaLiDa '19), 2019
-
Pseudonymization of Language Learner Data
Ingår i Workshop om pseudonymisering av textdata, 2019
-
The SweLL Language Learner Corpus: From Design to Annotation
Ingår i Northern European Journal of Language Technology (NEJLT), s. 67-104, 2019
- DOI för The SweLL Language Learner Corpus: From Design to Annotation
- Ladda ner fulltext (pdf) av The SweLL Language Learner Corpus: From Design to Annotation
-
The DECODE Database: Collection of Historical Ciphers and Keys
Ingår i Proceedings of the 2nd International Conference on Historical Cryptology, s. 69-78, 2019
-
SWEGRAM: Annotering och analys av svenska texter
2019
-
Towards a Generic Unsupervised Method for Transcription of Encoded Manuscripts
Ingår i Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, 2019
-
Annotation of learner corpora: first SweLL insights
Ingår i Abstracts of SLTC 2018, s. 86-89, 2018
-
Ingår i Proceedings of the 7th NLP4CALL, 2018
-
Proceedings of the 1st International Conference on Historical Cryptology: HistoCrypt 2018
2018
-
The HistCorp Collection of Historical Corpora and Resources
Ingår i DHN 2018, s. 306-320, 2018
-
Annotating Errors in Student Texts: First Experiences and Experiments
Ingår i Proceedings of Joint 6th NLP4CALL and 2nd NLP4LA Nodalida workshop, s. 47-60, 2017
-
SWEGRAM: A Web-Based Tool for Automatic Annotation and Analysis of Swedish Texts
Ingår i Proceedings of the 21st Nordic Conference on Computational Linguistics, Nodalida 2017., s. 132-141, 2017
-
Transcription of Encoded Manuscripts with Image Processing Techniques
Ingår i Proceedings of Digital Humanities 2017., 2017
-
A Friend in Need?: Research agenda for electronic Second Language infrastructure
Ingår i Proceedings of SLTC 2016, 2016
-
The Uppsala Corpus of Student Writings: Corpus Creation, Annotation, and Analysis
Ingår i LREC 2016, s. 3192-3199, 2016
-
Proceedings of the 20th Nordic Conference of Computational Linguistics
ACL Anthology, 2015
-
A Multilingual Evaluation of Three Spelling Normalization Methods for Historical Text
Ingår i Proceedings of the 8th Workshop on Language Technologyfor Cultural Heritage, Social Sciences, and Humanities(LaTeCH), s. 32-41, 2014
-
Professional language in Swedish clinical text: Linguistic characterization and comparative studies
Ingår i Nordic Journal of Linguistics, s. 297-323, 2014
-
The Secrets of the Copiale Cipher
Ingår i Research into Freemasonry and Fraternalism, s. 314-324, 2011
-
Ingår i Proceedings of the NODALIDA 2009 workshop Nordic Perspectives on the CLARIN Infrastructure of Language Resources, s. 1-5, 2009
-
Ingår i Multilingualism, 2009
-
Cultivating a Swedish Treebank
Ingår i Resourceful Language Technology, s. 111-120, Acta Universitatis Upsaliensis, 2008
-
Language Resources and Tools for Swedish: A Survey
Ingår i Proceedings of the Sixth International Language Resources and Evaluation (LREC 2008), 2008
-
Single Malt or Blended? A Study in Multilingual Parser Optimization
Ingår i Proceedings of the CoNLL Shared Task Session of EMNLP-CoNLL 2007, s. 933-939, 2007
-
General-Purpose Text Categorization Applied to the Medical Domain.
2007
-
The Swedish-Turkish Parallel Corpus and Tools for its Creation
Ingår i Proceedings of NoDaLida 2007, 2007
-
A Study on Automatically Extracted Keywords in Text Categorization
Ingår i Proceedings of International Conference of Association for Computational Linguistics, 2006
-
Exploring the Prosody-Syntax Interface in Conversations
Ingår i Proceeding of the 15th International Congress of Phonetic Sciences, 2003
-
Ingår i Proceedings of Fonetik 2002, 2002
Senaste publikationer
-
A Handwritten Text Recognition Dataset for Ajami Manuscripts in Fulfulde and Hausa
Ingår i Document Analysis and Recognition – ICDAR 2025, s. 620-637, 2025
-
Cipher key instructions in early modern Europe: analysis and text edition
Ingår i Cryptologia, s. 416-442, 2025
- DOI för Cipher key instructions in early modern Europe: analysis and text edition
- Ladda ner fulltext (pdf) av Cipher key instructions in early modern Europe: analysis and text edition
-
Keys with nomenclatures in the early modern Europe
Ingår i Cryptologia, s. 97-139, 2024
- DOI för Keys with nomenclatures in the early modern Europe
- Ladda ner fulltext (pdf) av Keys with nomenclatures in the early modern Europe
-
Towards Data-effective Educational Question Generation with Prompt-based Learning
Ingår i Intelligent Computing, s. 161-174, 2023
-
Historical Language Models in Cryptanalysis: Case Studies on English and German
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
- DOI för Historical Language Models in Cryptanalysis: Case Studies on English and German
- Ladda ner fulltext (pdf) av Historical Language Models in Cryptanalysis: Case Studies on English and German
Alla publikationer
Artiklar i tidskrift
-
Cipher key instructions in early modern Europe: analysis and text edition
Ingår i Cryptologia, s. 416-442, 2025
- DOI för Cipher key instructions in early modern Europe: analysis and text edition
- Ladda ner fulltext (pdf) av Cipher key instructions in early modern Europe: analysis and text edition
-
Keys with nomenclatures in the early modern Europe
Ingår i Cryptologia, s. 97-139, 2024
- DOI för Keys with nomenclatures in the early modern Europe
- Ladda ner fulltext (pdf) av Keys with nomenclatures in the early modern Europe
-
Ingår i Pattern Recognition Letters, s. 43-49, 2022
- DOI för Few shots are all you need: A progressive learning approach for low resource handwritten text recognition
- Ladda ner fulltext (pdf) av Few shots are all you need: A progressive learning approach for low resource handwritten text recognition
-
Deciphering Papal Ciphers from the 16th to the 18th Century
Ingår i Cryptologia, s. 479-540, 2021
- DOI för Deciphering Papal Ciphers from the 16th to the 18th Century
- Ladda ner fulltext (pdf) av Deciphering Papal Ciphers from the 16th to the 18th Century
-
Decryption of historical manuscripts: the DECRYPT project
Ingår i Cryptologia, s. 545-559, 2020
- DOI för Decryption of historical manuscripts: the DECRYPT project
- Ladda ner fulltext (pdf) av Decryption of historical manuscripts: the DECRYPT project
-
The SweLL Language Learner Corpus: From Design to Annotation
Ingår i Northern European Journal of Language Technology (NEJLT), s. 67-104, 2019
- DOI för The SweLL Language Learner Corpus: From Design to Annotation
- Ladda ner fulltext (pdf) av The SweLL Language Learner Corpus: From Design to Annotation
-
Parallel corpora and Universal Dependencies for Turkic
Ingår i Turkic languages, s. 259-273, 2015
-
Professional language in Swedish clinical text: Linguistic characterization and comparative studies
Ingår i Nordic Journal of Linguistics, s. 297-323, 2014
-
Bootstrapping a Persian Dependency Treebank
Ingår i Linguistic Issues in Language Technology, 2012
-
The Secrets of the Copiale Cipher
Ingår i Research into Freemasonry and Fraternalism, s. 314-324, 2011
-
Shallow Parsing with PoS Taggers and Linguistic Features.
Ingår i Journal of Machine Learning Research: Special Issue on Shallow Parsing, s. 639-668, 2002
Kapitel i böcker, delar av antologi
-
Supporting Research Environment for Less Explored Languages: A Case Study of Swedish and Turkish
Ingår i Resourceful Language Technology, s. 96-110, Uppsala universitet, 2008
-
Cultivating a Swedish Treebank
Ingår i Resourceful Language Technology. A Festschrift in Honor of Anna Sågvall Hein, s. 111-120, Acta Universitatis Upsaliensis, 2008
-
Cultivating a Swedish Treebank
Ingår i Resourceful Language Technology, s. 111-120, Acta Universitatis Upsaliensis, 2008
Konferensbidrag
-
A Handwritten Text Recognition Dataset for Ajami Manuscripts in Fulfulde and Hausa
Ingår i Document Analysis and Recognition – ICDAR 2025, s. 620-637, 2025
-
Towards Data-effective Educational Question Generation with Prompt-based Learning
Ingår i Intelligent Computing, s. 161-174, 2023
-
Historical Language Models in Cryptanalysis: Case Studies on English and German
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
- DOI för Historical Language Models in Cryptanalysis: Case Studies on English and German
- Ladda ner fulltext (pdf) av Historical Language Models in Cryptanalysis: Case Studies on English and German
-
What is the Code for the Code? Historical Cryptology Terminology
Ingår i Proceedings of the 6th International Conference on Historical Cryptology HistoCrypt 2023, 2023
- DOI för What is the Code for the Code? Historical Cryptology Terminology
- Ladda ner fulltext (pdf) av What is the Code for the Code? Historical Cryptology Terminology
-
The DECODE Database of Historical Ciphers and Keys: Version 2
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., s. 111-114, 2022
-
Lost in Transcription of Graphic Signs in Ciphers
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022, s. 153-158, 2022
-
Identifying Cleartext in Historical Ciphers
Ingår i Proceedings of the Workshop on Language Technologies for Historical and Ancient Languages. LT4HALA 2022., 2022
-
What Was Encoded in Historical Cipher Keys in the Early Modern Era?
Ingår i Proceedings of the 5th International Conference on Historical Cryptology. HistoCrypt 2022., 2022
-
Key Design in the Early Modern Era in Europe
Ingår i Proceedings of the 4th International Conference on Historical Cryptology (HistoCrypt 2021), 2021
- DOI för Key Design in the Early Modern Era in Europe
- Ladda ner fulltext (pdf) av Key Design in the Early Modern Era in Europe
-
Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
Ingår i Proceedings of the 4th International Conference on Historical Cryptology HistoCrypt 2021, 2021
- DOI för Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
- Ladda ner fulltext (pdf) av Unsupervised Alphabet Matching in Historical Encrypted Manuscript Images
-
Revealing Secrets from the Past: Studying Historical Ciphers.
2021
-
Ingår i Proceedings of the 28th International Conference on Computational Linguistics. COLING 2020, s. 357-369, 2020
-
Transcription of Historical Ciphers and Keys
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology, s. 106-115, 2020
-
Automatic Key Structure Extraction
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology, s. 146-152, 2020
-
A Web-based Interactive Transcription Tool for Encrypted Manuscripts
Ingår i Proceedings of the 3rd International Conference on Historical Cryptology HistoCrypt 2020, 2020
- DOI för A Web-based Interactive Transcription Tool for Encrypted Manuscripts
- Ladda ner fulltext (pdf) av A Web-based Interactive Transcription Tool for Encrypted Manuscripts
-
Matching Keys and Encrypted Manuscripts
Ingår i Proceedings of the 22nd Nordic Conference on Computational Linguistics (NoDaLiDa '19), 2019
-
Pseudonymization of Language Learner Data
Ingår i Workshop om pseudonymisering av textdata, 2019
-
The DECODE Database: Collection of Historical Ciphers and Keys
Ingår i Proceedings of the 2nd International Conference on Historical Cryptology, s. 69-78, 2019
-
Towards a Generic Unsupervised Method for Transcription of Encoded Manuscripts
Ingår i Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, 2019
-
Annotation of learner corpora: first SweLL insights
Ingår i Abstracts of SLTC 2018, s. 86-89, 2018
-
Ingår i Proceedings of the 7th NLP4CALL, 2018
-
The HistCorp Collection of Historical Corpora and Resources
Ingår i DHN 2018, s. 306-320, 2018
-
Annotating Errors in Student Texts: First Experiences and Experiments
Ingår i Proceedings of Joint 6th NLP4CALL and 2nd NLP4LA Nodalida workshop, s. 47-60, 2017
-
SWEGRAM: A Web-Based Tool for Automatic Annotation and Analysis of Swedish Texts
Ingår i Proceedings of the 21st Nordic Conference on Computational Linguistics, Nodalida 2017., s. 132-141, 2017
-
Transcription of Encoded Manuscripts with Image Processing Techniques
Ingår i Proceedings of Digital Humanities 2017., 2017
-
Swe-Clarin: Language Resources and Technology for Digital Humanities
Ingår i Digital Humanities 2016, s. 29-51, 2016
-
A Friend in Need?: Research agenda for electronic Second Language infrastructure
Ingår i Proceedings of SLTC 2016, 2016
-
The Uppsala Corpus of Student Writings: Corpus Creation, Annotation, and Analysis
Ingår i LREC 2016, s. 3192-3199, 2016
-
Ranking Relevant Verb Phrases Extracted from Historical Text
Ingår i Proceedings of the 9th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, 2015
-
A Multilingual Evaluation of Three Spelling Normalization Methods for Historical Text
Ingår i Proceedings of the 8th Workshop on Language Technologyfor Cultural Heritage, Social Sciences, and Humanities(LaTeCH), s. 32-41, 2014
-
Verb Phrase Extraction in a Historical Context
2014
-
Automatic Morphosyntactic Analaysis of Clinical Text
2014
-
EACL - Expansion of Abbreviations in CLinical text
Ingår i Workshop on Predicting and Improving Text Readability for Target Reader Populations, PITR 2014, 2014
-
A Multilingual Evaluation of Three Spelling Normalization Methods for Historical Text.
Ingår i Workshop on Language Technology for Cultural Heritage, Social Sciences and Humanities, LaTeCH 2014, 2014
-
Ingår i Proceedings of the 19th Nordic Conference on Computational Linguistics, 2013
-
An SMT Approach to Automatic Annotation of Historical Texts
Ingår i Workshop on Computational Historical Linguistics, Nodalida 2013., 2013
-
A Basic Language Resource Kit for Persian
Ingår i Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), s. 2245-2252, 2012
-
Rule-Based Normalisation of Historical Text – a Diachronic Study
Ingår i Empirical Methods in Natural Language Processing, s. 333-341, 2012
-
Parsing the Past - Identification of Verb Constructions in Historical Text
Ingår i Language Technology for Cultural Heritage, Social Sciences, and Humanities, 2012
-
Dependency Parsers for Persian
Ingår i Proceedings of 10th Workshop on Asian Language Resources, COLING 2012, 24th International Conference on Computational Linguistics, Mumbai, India, 2012
-
2011
-
Using Parallel Corpora in Data-Driven Teaching of Turkish in Sweden.
s. 1686-1689, 2010
-
The English-Swedish-Turkish Parallel Treebank
Ingår i Proceedings of Language Resources and Evaluation (LREC 2010), 2010
-
Ingår i Proceedings of the NODALIDA 2009 workshop Nordic Perspectives on the CLARIN Infrastructure of Language Resources, s. 1-5, 2009
-
The Open Source Tagger HunPoS for Swedish.
Ingår i Proceedings of the 17th Nordic Conference on Computational Linguistics (NODALIDA), 2009
-
Ingår i Multilingualism, 2009
-
Swedish-Turkish Parallel Treebank
Ingår i Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), 2008
-
Language Resources and Tools for Swedish: A Survey
Ingår i Proceedings of the Sixth International Language Resources and Evaluation (LREC 2008), 2008
-
Bootstrapping a Swedish Treebank Using Cross-Corpus Harmonization and Annotation Projection
Ingår i Proceedings of the 6th International Workshop on Treebanks and Linguistic Theories, s. 97-102, 2007
-
Single Malt or Blended? A Study in Multilingual Parser Optimization
Ingår i Proceedings of the CoNLL Shared Task Session of EMNLP-CoNLL 2007, s. 933-939, 2007
-
The Swedish-Turkish Parallel Corpus and Tools for its Creation
Ingår i Proceedings of NoDaLida 2007, 2007
-
Single Malt or Blended? A Study in Multilingual Parser Optimization.
Ingår i Proceedings of the CoNLL Shared Task Session of EMNLP-CoNLL 2007, 2007
-
Bootstrapping a Swedish Treebank Using Cross-Corpus Harmonization and Annotation Projection.
Ingår i Proceedings of Treebanks and Linguistic Theories, 2007
-
A Study on Automatically Extracted Keywords in Text Categorization
Ingår i Proceedings of International Conference of Association for Computational Linguistics, 2006
-
Building a Swedish-Turkish Parallel Corpus
Ingår i Proceedings of Language Resources and Evaluation Conference, 2006
-
Using Linguistic Data for Genre Classification
Ingår i Proceedings of SAIS-SSLS, 2005
-
The Acoustic and Morpho-Syntactic Context of Prosodic Boundaries in Dialogs.
Ingår i Proceedings of Fonetik 2003, 2003
-
Exploring the Prosody-Syntax Interface in Conversations
Ingår i Proceeding of the 15th International Congress of Phonetic Sciences, 2003
-
Silence and Discourse Context in Read Speech and Dialogues in Swedish
Ingår i Proceedings of the Speech Prosody 2002 conference, s. 363-366, 2002
-
Ingår i Proceedings of Fonetik 2002, 2002
-
Ingår i Proceedings of ICSLP'2002 - 7th International Conference on Spoken Language Processing, 2002
-
Data-Driven Methods for Building a Swedish Treebank.
Ingår i Swedish Treebank Symposium, 2002
-
Pausing in Dialogues and Read Speech: Speaker's Production and Listeners Interpretation
Ingår i Proceedings of the Workshop on Prosody in Speech Recognition and Understanding, 2001
-
Comparing Data-Driven Learning Algorithms for PoS Tagging of Swedish
Ingår i Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2001), 2001
-
A Comparative Study of Pauses in Dialogues and Read Speech.
Ingår i Proceedings of Eurospeech 2001, s. 931-935, 2001
-
Data-Driven Methods for PoS tagging and Chunking of Swedish
Ingår i In the Proceedings of the Nordic Conference on Computational Linguistics, Nodalida 2001, 2001
-
Phrasal Parsing by Using Data-Driven PoS Taggers
Ingår i Proceedings of the Conference on Recent Advances in Natural Language Processing, s. 166-173, 2001
-
Ensemble of Classifiers for Noise Detection in PoS Tagged Corpora
Ingår i Proceedings of the Third International Workshop on TEXT, SPEECH and DIALOGUE, s. 27-32, 2000
-
Towards a Finite-State Parser for Swedish
Ingår i Proceedings of NoDaLiDa 99, s. 115-123, 2000
-
Improving Brill's PoS Tagger for an Agglutinative Language
Ingår i Proceedings of the Joint Sigdat Conference on Empirical Methods in Natural Language Processing and Very Large Corpora, s. 275-284, 1999
-
Brill's PoS Tagger with Extended Lexical Templates for Hungarian
Ingår i Proceedings of the Workshop (W01) on Machine Learning in Human Language Technology, s. 22-28, 1999
Proceedings (redaktörskap)
-
2023
-
Proceedings of the 5th International Conference on Historical Cryptology
2022
-
Proceedings of the 3rd International Conference on Historical Cryptology
2020
- Ladda ner fulltext (pdf) av Proceedings of the 3rd International Conference on Historical Cryptology
-
Proceedings of the Workshop on NLP and Pseudonymisation
2019
-
Proceedings of the 1st International Conference on Historical Cryptology: HistoCrypt 2018
2018
Rapporter
-
SweLL transcription guidelines, L2 essays
2021
-
Transcription of Historical Ciphers and Keys: Guidelines, version 2.0
2021
-
SweLL Pseudonymization Guidelines
2021
-
Transcription of Historical Ciphers and Keys: Guidelines
2020
-
SWEGRAM: Annotering och analys av svenska texter
2019
-
The Open Source Tagger HunPoS for Swedish
2008
-
Survey on Swedish Language Resources
2008
-
Supporting Research Environment for Swedish and Turkish
2008
-
Converting SUC2.0 to XCES with stand-off annotation
2007
-
Changing the tokenization in Talbanken to SUC2.0
2007
-
General-Purpose Text Categorization Applied to the Medical Domain.
2007
Samlingsverk (redaktörskap)
-
Proceedings of the 20th Nordic Conference of Computational Linguistics
ACL Anthology, 2015
-
Resourceful Language Technology: Festschrift in Honor of Anna Sågvall Hein
Acta Universitatis Upsaliensis, 2008