Omvandla användarnas berättelser till signaler om vaccinsäkerhet: Avancerad textanalys av syndromiska appdata i Storbritannien och Sverige
Effektiv säkerhetsövervakning av läkemedel efter godkännande är avgörande för att övervaka säkerheten hos godkända vacciner i befolkningen. För att övervinna nuvarande metodologiska utmaningar utvecklade vi ett arbetsflöde för att extrahera signaler från användargenererade fritextberättelser om COVID-19-vaccination med hjälp av en syndromisk app.
Grundinformation
- Finansiär: Hjärt-Lungfonden, Vetenskapsrådet,ZOE Limited bidrog med att bygga, driva och stödja appen och tjänsten.
Projektbeskrivning
Vaccination är en hörnsten i folkhälsoarbetet och förhindrar miljontals dödsfall varje år genom att minska risken för infektionssjukdomar. Covid-19-pandemin visade hur viktigt det är med snabb vaccinutveckling och massvaccinering. Oro över biverkningar efter immunisering understryker dock behovet av rigorös övervakning efter godkännande för att upprätthålla allmänhetens förtroende och säkerhet.
Denna studie utvecklar ett arbetsflöde för att extrahera vaccinsäkerhetssignaler från användargenererade berättelser om COVID-19-vaccination med hjälp av ZOE Covid Symptom Study-appen i Storbritannien och Sverige. Signaler är tidiga indikatorer på en potentiell koppling mellan ett vaccin och en negativ händelse. Signalerna kan användas tillsammans med resultat från andra källor för att vägleda läkare och experter på biverkningsbevakning till ytterligare undersökningar och hjälpa dem att avgöra om lagstiftningsåtgärder är nödvändiga.
Vår studie omfattar uppgifter från 24 626 brittiska deltagare (16 oktober 2020 - 3 november 2021) och 812 svenska deltagare (14 december 2020 - 12 februari 2022). Vi analyserade fritext¬inlämningar med fokus på berättelser två månader före och efter vaccinationen. Vi använde Large Language Models och Natural Language Processing-pipelines som utvecklats av spaCy för att utföra textbehandling, inklusive tokenisering och lemmatisering. Vi utför ämnesmodellering med BERTopic för att skapa täta ordkluster och sammanhängande ämnen för kontextbaserad semantisk mönsteranalys. Vårt tillvägagångssätt syftar till att förbättra övervakning av vaccinsäkerhet i realtid.