AI, robothand, dator, ML machine learning, kalkylator, beräkningar

Doktorandprojekt: Dokumentklassifikation och entitetsextraktion

Många aspekter av bokföring är svåra att automatisera då det finns mycket information i ostrukturerad form. Målet med detta projekt är att använda oss av den modernaste teknologin inom AI och maskininlärning för att hitta lösningar inom bokföring.

Fakta om projektet

Doktorand
Nemi Pelgrom
Huvudhandledare
Morgan Ericsson
Biträdande handledare
Jonas Nordqvist, Håkan Grahn (BTH)
Deltagande organisationer
Linnéuniversitetet, Fortnox
Finansiär
Fortnox, KK-stiftelsen (Industriforskarskolan för Data Intensive Applications + (DIA+))
Tidsplan
September 2023–september 2028
Ämne
Data- och informationsvetenskap (institutionen för datavetenskap och medieteknik, fakulteten för teknik)
Forskargrupper
Data Intensive Software Technologies and Applications (DISTA)
Linnaeus University Centre for Data Intensive Sciences and Applications (DISA)

Mer om projektet

Projektet fokuserar på att utforska genomförbarheten av automatiserade beslutsstödssystem för ostrukturerad information som används t.ex för bokföring.

Forsknings uppgifterna kan innebära, men är inte begränsade till, följande problem:

  • Dokumentklassificering, dokument som fakturor och kvitton behöver automatiskt bedömas och klassificeras, vilket kan kräva modeller tillämpade för att arbeta med bild- och textdata.
  • Entitetsextraktion, att kunna urskilja och identifiera viktig information från ostrukturerade dokument är avgörande för ovan nämnda automatisering.
  • Robusthets- och tillförlitlighetsanalys, för att veta att metoderna är sunda, finns det ett behov av att undersöka metodernas robusthet.
  • Villkorligt lärande, i alla system utformade för att hjälpa människor, finns en möjlighet att förbättra AI/ML-modellerna genom att införliva en förhandskunskap och logiska resonemang från domänexperter. Detta tillvägagångssätt, känd som villkorad inlärning, tillåter metoderna att anpassa sig och utnyttja expertisen effektivt. Men för att uppnå detta är det avgörande för de metoder som används att de kan villkoras sådan kunskap.

Projektet är en del av forskningen i forskargruppen Data Intensive Software Technologies and Applications (DISTA) och Linnaeus University Centre for Data Intensive Sciences and Applications (DISA).