Många olika mediciner/tabletter i en glasburk.

Såddprojekt: Användning av naturliga språkmodeller för att extrahera läkemedelsrelaterade problem (NLMED)

Det övergripande målet med forskningen i detta såddprojekt inom Linnaeus University Center for Data Intensive Sciences and Applications (DISA) är att utforska den senaste tekniken inom naturliga språkmodeller för att hitta information i klinisk text som är relevant för oönskade läkemedelseffekter (ADE) och biverkningar.

Fakta om projektet

Även om det är möjligt att dokumentera bekräftade eller misstänkta biverkniningar i journalsystemens strukturerade information, eller att rapportera biverkningarna till Läkemedelsverket är det vanligt att detta inte görs. I stället dokumenteras information om misstänkta biverkningar i fritext i journalsystem, vilket försvårar övervakning och forskning på populationsnivå av misstänkta biverkningar. Det finns ett tydligt behov av att studera kliniska texter för att hitta och extrahera indikationer på möjliga biverkningar och oönskade läkemedelshändelser.

Namn
Användning av naturliga språkmodeller för att extrahera läkemedelsrelaterade problem från klinisk journaltext - NLMED
Sökande
Alisa Lincke, Elizaveta Kopacheva, Tora Hammar, Olof Björneld, Morgan Eriksson
Projektperiod
Juli 2023 – mars 2024
Huvudsakliga forskningsområden
Ehälsa, hälsoinformatik, farmakovigilans, datavetenskap, förståelse av naturliga språkmodeller
Finansiär
Linnaeus University Centre for Data Intensive Sciences and Applications (DISA)
Forskargrupp
Linnaeus University Centre for Data Intensive Sciences and Applications (DISA)

Mer om projektet

Farmakovigilans är ett viktigt område som fokuserar på att förebygga och upptäcka oönskade läkemedelseffekter (ADE) för att säkerställa säker medicinering för samhället. ADE står för en betydande andel av sjukhusinläggningar globalt, och i Sverige är de den sjunde vanligaste dödsorsaken. Att detektera ADE från kliniska texter är utmanande på grund av olika faktorer såsom patientegenskaper, läkemedel och läkemedelsegenskaper. Kliniska texter, inklusive elektroniska patientjournaler (EHR), är viktiga källor för att dokumentera misstänkta ADE. Tyvärr missar kliniker ofta att ange tydliga diagnoskoder för ADE, vilket gör det svårt att övervaka dem från strukturerade data. Det finns därför ett behov av att studera kliniska texter för att extrahera indikationer på möjliga ADE.

Tidigare forskning har identifierat tre deluppgifter inom ADE-detektering: namngiven entitetigenkänning (NER) för att extrahera relevant information, relationsutvinning (RE) för att etablera samband mellan entiteter och integrerad NER-RE för att avgöra förekomsten av ADE. Tidiga metoder för ADE-detektering var regelbaserade, men deras prestation nådde inte upp till önskade standarder. Nyligen har studier kombinerat regelbaserade metoder med maskininlärningstekniker för att dra nytta av övervakad maskininlärning för mer tolkbara resultat.

Dock är noggrannheten hos ADE-detektionsmodeller fortfarande otillfredsställande, med obalanser mellan precision och återkallelsemått. Tidigare studier har fokuserat på specifika geografiska områden och undersökt effekterna av endast en typ av medicin, vilket begränsar deras generaliserbarhet. De senaste framstegen inom naturlig språkbearbetning (NLP), såsom finjustering av modeller som BERT, har visat på märkbara förbättringar i ADE-detektering inom kliniska texter.

Målen med detta såddprojekt inkluderar att genomföra en litteraturöversikt över state-of-the-art NLP-modeller för ADE-detektering, ansöka om etiskt godkännande för att få tillgång till kliniska texter, skapa en märkt datamängd bestående av 2000 kliniska texter, annotera texterna för träning/validering/testning, välja och tillämpa två NLP-modeller på datamängden, genomföra en pilotstudie om NLP-funktionsteknik, och skriva ett konferensmanus. Det övergripande målet är att lägga grunden för vidare forskning inom förståelse av naturliga språkmodeller och deras tillämpbarhet inom analys av kliniska texter, och hur det i förlängningen kan användas tillsammans med metoder för att predicera läkemedelsproblem med strukturerad hälsodata.

Vad är ett såddprojekt?

Ett såddprojekt är ett mindre projekt som finansieras av en kunskapsmiljö eller en forskargrupp vid universitetet. Avsikten är att starta och främja framstående forskning. Beroende på finansiär kan ett såddprojekt handla om att identifiera nya eller fördjupa befintliga samarbeten, gärna tvärvetenskapliga, att utforska forskningsfrågor i en förstudie, att samla empiriskt material eller att skriva en ansökan om externa forskningsmedel.

DISAs såddprojekt

Läs mer om konceptet med såddprojekt och DISAs övriga såddprojekt.