I media leser vi daglig om Big Data og hvordan dette vil påvirke oss på godt og vondt. Internasjonalt har Norge kommet relativt langt i digitaliseringen og helsesektoren er på full fart inn i denne gjennom sine moderniseringsprogrammer. Stort sett alle bransjer ønsker å digitalisere, men flere er usikre på hvordan dette arbeidet bør gjennomføres. Virksomheter som allerede er i gang har erfart at det handler mer om å endre forretningsprosessene enn å innføre nye system og teknologi.
Fra forvirring til innsikt
Hvor kommer Big Data fra og hvor vil vi finne disse i helse- og omsorgssektoren? Endringer i datamengder og karakteristikker vil i stor grad oppstå gjennom at fysiske objekter i økende grad blir knyttet til internett. Dette kalles IoT, dvs. «tingenes internett», der objektene kommuniserer med hverandre og genererer derved datatrafikk.
Innen helse kan dette være store objekter, slik som transportutstyr (ambulanser), bygninger (smarthus), utstyr på avdelingene (måleutstyr, senger, inventar) eller i hjemmesykepleien (trygghetsteknologi og hjelpemidler). Men den store bølgen vil komme i form av billige, masseproduserte produkter som vil friste helsevesenet både gjennom pris, kvalitet og sin enkelthet. Mye av dette utstyret vil være bransje- og virksomhetsuavhengig som for eksempel «på kroppen utstyr»; bekledning, sko, briller, eller kommunikasjonsutstyr og lyspærer.
Omfanget gir oss nye utfordringer, men Big Data handler ikke bare om volumer. Dette er det forsket mye på og det vi ser er at Big Data i enkleste form kan beskrives gjennom tre dimensjoner; volum, variasjon og hastighet. Det er endringer i kombinasjoner langs disse tre dimensjonene som skaper raske skifter, nye kombinasjoner og setter analysemodellene på prøve. Beregningene våre kan da møte utilsiktede utfordringer som skaper problemer og derved gi feil resultat. Dette kaller falske positiver og at estimatene er beregnet utenfor modellens gyldighetsområde. I pasientbehandling og gjennomføring av omsorgsplaner er dette svært uheldig.
Teknologien gir oss et mulighetsrom. Spørsmålet vil være om vi klarer å utnytte mulighetsrommet for å oppnå bedre livskvalitet til en lavere pris og risiko. Blir vi mer sårbare? Det siste handler mye om troverdighet og tiltro til sårbarhetsanalyser. Når det gjelder Big Data og sårbarhet må vi tenke nytt. Det hjelper ikke om risiko i egne prosesser er tilfredsstillende og håndterbare hvis hackere slår av strømmen på sykehuset eller kontrollsentralen for omsorgstjenestene og krever løsepenger.
Datareduksjonsteknikker og Big Data
I dag hører vi at globale datamengder dobles hver 18 måned og at 90% av informasjonen i dag ikke fantes for to år siden. For et par titalls år tilbake var vi 16 millioner internettbrukere, mens vi i dag er 3 milliarder. Tekstinformasjon eksploderer, det popper opp myriader av nye brukerfelleskap og foredlede helsedata er blitt verdifull handelsvare for kommersielle tilbydere. Hvor tar dine helsedata veien når du haker av på «share with other users» i helsenettverk, hva er de verdt og hva får du egentlig tilbake?
For at vi skal kunne oppnå god nytte av Big Data innen helsehjelpen eller som pasient/beboer må vi ha tilgang til teknologi og metoder som henter ut det substansielle innholdet. Vi må kunne kunne fjerne støy, irrelevant informasjon og data med tvilsom kvalitet/lav troverdighet. Det er dette vi i SAS Institute kaller dataproduksjonsteknikker og det er dette som vil være plattformen for å kunne utnytte Big Data på en hensiktsmessig måte. Avansert analyse er datareduksjon og Big Data trenger reduksjonsteknikker. Gjennom F&U og praktisk utprøving gjennom prosjekter har vi festet oss med fire teknikker som vi mener vil bidra til å løse Big Data utfordringene innen helse og omsorgssektoren:
- Flytte beregninger nær datakilden. Her blir analysene i størst mulig grad utført ute på målepunktet og vi unngår å overføre unødvendig informasjon
- Kvitter oss med tekst. Dette gjør vi med å benytte avansert tekstanalyse som sørger for at tekst blir til tall
- Utnytter i minnehåndtering. Her vil innsamling, kvalitetskontroll, harmonisering og analyse av Big Data bli utført i høyhastighetssystemer, det teknologer kaller «In memory» eller «In database» operasjoner. Foredlede resultat videreføres i forretningsprosessene
- Benytte maskinlæring. Her bytter vi ut statiske modeller med modeller basert på maskinlæring hvor etterprøving av validitet i eksisterende modellportefølje utføres løpende samtidig som det bygges nye dynamiske modeller som takler endringer og kvalitetskrav.
Big Data - mulighetsrom for et paradigmeskifte?
Helsevesenet må gjennom en modernisering for å møte både bemannings- og kostnadsutfordringene i tiden fremover mot 2025. Retningen for dette arbeidet er beskrevet i Meld. St. 27 «Digital agenda for Norge — IKT for en enklere hverdag og økt produktivitet». De digitaliseringsprogrammene som er igangsatt er svært viktige, men det ligger et ytterligere potensiale hvis helsesektoren klarer å integrere eksterne Big Data, bl.a. ved å ta i bruk innovative digitale teknologier og at pasient/beboer i større grad får rollen som dataleverandør og operatør. Dette gir økt grad av fleksibilitet i behandlingen og oppgavene kan organiseres på en effektiv måte noe som vil kunne redusere kostnadene.
God utnyttelse av Big Data reiser et omfattende opplæringsbehov både på helsearbeidersiden og på pasient-/beboersiden. Når dette er på plass får vi et mulighetsrom for få på plass bedre og mer effektive arbeidsprosesser. Vi kan redusere og forenkle manuell rutiner hvor gevinsten vil være mer tid til helhetlig pasientbehandling.
I parallell med dette må det foregå et systematisk arbeid for å avdekke risikobildet knyttet til Big Data og innføres tilfredsstillende sikkerhetsmekanismer og tiltak som ivaretar pasientsikkerheten og behandlingen.
Har du en datastrategi ift. utnyttelse av alle verdifulle data? Lær mer her: The 5 Essential Components of a Data Strategy
Big Data i praksis
I april 2009 fikk vi det første utbrudd på 90 år av svineinfluensa. Kilden var i Veracruz i Mexico. Her smittet en mutant versjon av H1N1 viruset raskt menneskene i lokalmiljøet, inkludert turistene. På grunn av omfattende turisttrafikk ble viruset deretter spredd til andre distrikter i Mexico og videre til andre land og kontinenter. Spredningen utviklet seg eksplosivt.
Først i august 2010 kunne WTO avblåse kampen mot epidemien. Offisielle anslag på døde var da 285-560 tusen. Spørsmålet som fortsatt diskuteres er hvor mange av disse liv kunne vært spart dersom de tidligste tilfellene i Veracruz hadde blitt anerkjent som selve kimen til utbruddet? Kunne de neste utbruddene være forutsett hvis helsemyndighetene hadde klart å koble sammen data om nye utbruddspunkter, dvs. gjennom analyse av Big Data?
I dag vet vi at informasjonsflyten under epidemien til dels var kaotisk og helsemyndighetene klarte først etter lang tid å bedre det substansielle innholdet i all innrapporteringen for å bygge tilstrekkelige tiltak.
Ønsker du å høre mer om hvordan helsesektoren kan bli mer effektiv og jobbe bedre ved hjelp av datadrevet ledelse og analyse? Den 7.-8. september inviterer Helse Nord og SAS Institute til en inspirasjons- og kunnskapskonferanse der du kan lære mer om dette.
Inge Krogstad var en av foredragsholderne under konferansen Pasientsikkerhet og teknologi, Lillehammer 19.-20. april 2016: klinIKT2016
Se hans presentasjon Big Data - pådriver for modernisering innen helse og omsorg