Ny forskning: Användning av multipla inbäddningar för visuellt styrd analys av textlikhet
Att förstå stora datamängder är en allmän och viktig utmaning som förekommer inom många forskningsfält och verkliga scenarier. Många olika specifika beräkningsmetoder för datautvinning och analys har utvecklats.
Intressant nog är flera av dessa (t.ex klustring) baserade på likhetsberäkningar vilket vid en första anblick kan verka både intuitivt och enkelt. I själva verket bjuder dock likhetsbegreppet, på grund av sin subjektiva natur, på flera svåra utmaningar både när det gäller de faktiska beräkningarna och den visuella representationen.
Daniel Witschard är doktorand på Linnéuniversitetet med fokus på Visuell analys (VA) och ingår i forskargruppen ISOVIS men hans tid som doktorand har sett ganska annorlunda ut gentemot de flesta andras. Till att börja med är Daniel en så kallad egenfinansierad doktorand, vilket innebär att hans lön varken har finansierats av universitets forskningsmedel eller något externt forskningsprojekt. Daniel har inte heller befunnit sig på plats på Linnéuniversitetet mer än vid några enskilda tillfällen, istället har han befunnit sig i Vietnam under stora delar av doktorandtiden och haft kontakt med handledare och andra doktorander online.
- Den största skillnaden för en egenfinansierad doktorand är att man inte är anställd av universitetet och därför inte har någon undervisningsplikt eller liknande. I mitt fall var det en förutsättning eftersom jag bodde utomlands största delen av projektet. På det stora hela har det fungerat bra med distansstudier och möten via Zoom, men den största nackdelen är naturligtvis att jag inte kunnat vara delaktig i det dagliga akademiska utbytet på samma sätt som om jag varit på plats i Växjö.
Tillsammans med sitt handledarteam har han identifierat ett aktuellt forskningsgap gällande behovet av ett övergripande metodik för att utvärdera, jämföra och kombinera olika modeller inom ramen för likhetsberäkningar. Avhandlingen baseras på en serie publikationer med den gemensamma tråden att utveckla ett sammanhängande VA-ramverk för likhetsbaserad analys av stora textdatamängder. En ledstjärna för projektet har varit att skapa väl designade visualiseringar som, utöver själva analysresultatet, också förmedlar kunskap och insikt om hur resultatet kom till och hur mycket man kan lita på det.
Den 12 juni är det dags för Daniel att presentera och försvara sin avhandling och när vi frågar honom hur det känns och vilka de viktigaste lärdomarna är svarar han
- Det känns bra och lite overkligt att nu knyta ihop säcken efter 5 års hårt, och väldigt roligt, arbete. De viktigaste lärdomarna från våra resultat är att det inte alltid är så lätt att avgöra vad som är rätt och fel när man försöker räkna på likhet. Därför är bra visualiseringar av största vikt för att förmedla insikten att det ofta finns många tänkbara lösningar och inte bara en enda. De viktigaste lärdomarna från själva projektet är att det lönar sig att inte ge upp. Jag hade en lång och tung period då allt jag skickade in blev refuserat, men tack vare stöd och uppmuntran från mina handledare tog jag mig igenom det – och nu står jag här och ska snart disputera.
Vi önskar Daniel varmt lycka till!
Vill du delta vid disputationen hittar du mer praktisk information här: https://lnu.se/mot-linneuniversitetet/aktuellt/kalender/2025/disputation-i-data--och-informationsvetenskap-for-daniel-witschard-20250612/
För mer information om Daniels forskning: https://lnu.se/forskning/forskningsprojekt/doktorandprojekt-vektorinbaddning-for-analys-och-visualisering-av-multivariata-natverk/