Forretningsverdenen har længe brugt software og it-redskaber til at analysere store mængder data, tal, klartekst og andre ikke-strukturerede data. Nu er der også redskaber på vej til sundhedsvæsenet. De kan analysere de delvist strukturerede og ustrukturerede digitale data, der findes i EPJ, og præsentere lægen for forslag og konklusioner, han kan vælge imellem.

I forretningsverdenen har redskaberne typisk været anvendt til at overskue store måledata og for eksempel produktions- og regnskabsdata og trække relevante nøgletal ud, overvåge udviklinger og skabe blik for ellers usynlige sammenhænge.

Disse redskaber har i forretningsverdenen blandt andet gået under navnet business intelligence (BI).

Selvom denne betegnelse ikke rigtig giver mening i sundhedsvæsenet, og man her måske hellere skulle tale om health intelligence, er formålet ofte det samme for klinikere: Store mængder data skal på kort tid overskues og danne grundlag for en beslutning.

Hidtil har det været op til lægens hjerne at skabe dette overblik, drage en konklusion, tage en beslutning og planlægge handling ud fra dette, men nye it-redskaber sigter på at skabe støtte til processen.

Tekst-analyse
I første omgang har især billeddiagnostiske afdelinger gjort brug af redskaberne til analyse af billeder, men nu kommer redskaber, som også kan inddrage andre slags data – i særlig grad tekstdata.
Der findes allerede – trods en endnu manglende fælles EPJ i Danmark – masser af mere eller mindre strukturerede digitale tekstdata fra journaler, laboratoriesvar fra vævsprøver, blodprøver med videre, operationsnotater osv.

Disse data kan analyseres og struktureres af softwaren, og når lægen får en ny patient med symptomer, der ligner tidligere beskrevne, kan it-systemet præsentere en række valgmuligheder for behandling og medicinering eller prognoser. Det sker på baggrund af tidligere patienters historie – historier som it-systemet netop kender fra analyse af de tidligere gemte data som for eksempel tekst fra elektroniske patientjournaler.

Eksempelvis kan grupper af patienter med lignende symptomer have fået forskellig behandling eller medicinering tidligere. Med de nye redskaber kan man se, hvad der tidligere har virket bedst.

Statistisk analyse af tekst
I USA har man allerede taget disse software-redskaber til analyse af tekster i brug. Redskaberne går under betegnelsen textmining, som er en delmængde af datamining. Teknikken foretager en statistisk analyse af teksten og finder interessante eller vigtige ord og tillægger dem en vægt. Dermed er teksten blevet struktureret, og man kan foretage almindelig datamining bagefter.

Fordelen ved textmining er, at man kan gøre brug af relativt ustrukturerede data til at foretage avancerede analyser.

Tidligere var forudsætningen for gode analyser, at data i forvejen var strukturerede, men nu kan man også gøre brug af den vidensbank som de ustrukturerede data udgør, for eksempel den ustrukturerede tekst i EPJ.

“Textmining er et redskab til at skabe struktur i ustrukturerede data, som dele af EPJ består af. Så kan man analysere disse data alene eller sammen med de mere strukturerede data, man eventuelt har på samme patienter. Dermed kan man gruppere patienter med fælles symptomer, så lægen kan få data om udviklingen for tidligere patienter, hvordan de blev behandlet, hvad deres baggrundsdata var osv.,” siger Stine Fangel, der er forretningsrådgiver i SAS Institute, der sælger redskaberne.

Redskaberne er også blevet brugt herhjemme, blandt andet på karkirurgisk afdeling på Gentofte Hospital, hvor man har brugt dem til at forudsige overlevelse blandt patienter, der står over for operation.

Prognosen bliver lavet på baggrund af data om, hvad der er sket med lignende patienter. Dermed kan man se sammenhænge mellem patienters status før operation og overlevelseschancer efter operation, hvor der er taget højde for rygning, overvægt osv.

Leif Panduro Jensen, ledende overlæge på afdelingen, håber, at den kommende EPJ-udbredelse kan bruges til øget brug af text- og datamining.

“Vi håber at kunne samle al datafødning via EPJ’en. Men jeg er bekymret for, at man sætter ambitionsniveauet for lavt. Hvis det bare bliver strøm til papir, er det ikke interessant set fra en klinisk synsvinkel,” har han tidligere sagt til Computerworld.

Textmining

  • Textmining kan gennemtrawle ustrukturerede data fra dokumenter, som e-mails, patientjournaler, diktater og lignende.
  • Med komplicerede algoritmer findes der ukendte sammenhænge i datamængderne.
  • Textmining ser blandt andet på, hvor og hvor ofte ordene optræder, teksternes indbyrdes relationer og informationsmønstre i dem.
  • Ideen er, at der på basis af de fundne sammenhænge kan træffes intelligente beslutninger.

Af Steffen Fog