Hur man lär en dator läsa Gustav III:s handstil

Att läsa någons handstil kan ibland vara en utmaning. Hade du till exempel kunnat läsa Gustav III:s? Det var just vad ett tiotal personer ägnade sig åt under ett så kallat hackathon, en form av workshop arrangerad av Uppsala universitetsbibliotek.

Ett program hade i förväg med hjälp av HTR (handwritten text recognition) läst in texterna och vid workshoptillfället hjälptes deltagarna åt att rätta de ord som programmet inte lyckats tyda. Rättningarna matades sedan tillbaka till programmet. Texterna som lästes vid det här tillfället var Gustav III:s handskrivna riksdagstal.
Malin Barkelind, bibliotekarie vid universitetsbiblioteket ledde workshopen och berättar om några utmaningar som mötte deltagarna:
Något som är lite speciellt när man transkriberar i syfte att träna en HTR-modell är att man måste skriva som det faktiskt står. För att datorn ska bli bättre på att läsa bokstäverna måste vi transkribera exakt, inte rätta till. Ett sådant exempel är att vi märkte att Gustav III har råkat skriva ”bibehellås” där det uppenbart ska stå ”bibehållas”. Det har nog gått lite för fort och ringen över å kanske missats och satts dit i efterhand. Här måste vi transkribera som det faktiskt står för att datorn ska känna igen bokstäverna rätt på andra ställen.
Att stava som på 1700-talet
En annan utmaning för deltagarna var att läsa 1700-talssvenska, där stavningen är annorlunda mot vad vi är vana vid idag. Till exempel kan ”Rikets självständighet” stavas ”Rickets skielfstandighett” och deltagarna märkte att det gick lättare att förstå texten om den lästes upp högt.
Fler hackathon i vår
Planering pågår för att kunna arrangera fler hackathon under vårterminen. Mer information kommer i kalendariet på universitetsbibliotekets webbplats.
Att arrangera hackathon om Gustav III:s material är en del i projektet ”Av Gustavs hand: Digitalisering, digital berikning och förmedling av Gustav III:s arkiv”