Maskinlæring konkurrerer ut klassisk analyse

Utsagnet maskinlæring konkurrerer ut klassisk analyse, vil kanskje få deg til å stusse. Men, vi har i senere tid krysset noen broer som i mange år har begrenset praktisk bruk av maskinlæring.

Data Scientist-rollen blir svært viktig for at virksomhetene skal lykkes. Det er denne rollen som sammen med forretningsanalytikere skal ta de viktige og smarte valgene knyttet til algoritmer, og hvordan disse spiller sammen med Big Data og regnekapasitet. For det er kun de smarte løsningene som skal implementeres slik at virksomhetene faktisk får uttelling for, og kan se nytten og effekten av, å endre sine analysestrategier fra det reaktive til det proaktive.

Tre pilarer
Dataanalyse som bygger på maskinlæring hviler i dag stort sett på tre pilarer; algoritmer, data og regnekapasitet. Mange av de algoritmer som brukes er utviklet langt tilbake i tid. Men i dag har vi gjennom defaktorisering bygget om disse slik at de kan kjøres distribuerte eller i klynger. SAS Institute bruker flere av disse tidløse teknikkene, bl.a. innen svindelløsningene våre.

Stordata (big data) karakteriseres ofte langs dimensjonene store volum med raskt skiftende innhold. De fleste statistiske analyser bygger på klare forutsetninger hvor vi må foreta konkrete modellvalg og dermed forholde oss til en rekke forutsetninger. Utfra dette kan det tenkes at raskt skiftende data kan føre til at analysen ikke lengre kan løses på en god måte, eller rett og slett gir feil resultat. Vi vil også kunne oppleve feilkalkulasjoner gjennom at vi for eksempel forer modellen med parametere utenfor gyldighetsområdet.

Nye erfaringer, ny læring
Vi mennesker høster daglig erfaringer, og dermed også daglig læring. Dataprogrammer kan også lære gjennom erfaring. Gjennom algoritmer videreføres læringen til datamaskinen eller smarttelefonen. I går brukte jeg tekstbehandling for å skrive et notat. I dag opplever jeg at grensesnittet i tekstbehandlingen er endret utfra hva jeg benyttet i går, mine feil og hva jeg strevde med. Det vil si at mine kvaliteter, ferdigheter og produktivitet er analysert på leting etter mulige forbedringer. Disse analysene er utført «på bakrommet» ved hjelp av SAS-applikasjoner uten at jeg trenger å bli involvert. Maskinlæringen har med andre ord forbedret tekstbehandlingssystemet for meg som bruker. Programvaren har tilpasset seg tema, arbeidsvanen og ferdigheten til neste gang jeg skal bruke programmet.

Som nevnt, handler bruk av statistisk analyse mye om å lykkes i å velge en riktig modell som kan tolke verden gjennom å beskrive relasjoner mellom to eller flere variabler. I maskinlæring er rollene byttet om gjennom at data som inneholder fasiten benyttes for å trene algoritmene. Vi har treningsdata hvor alle eller deler av transaksjonene har kjente utfall. Jobben er å be datamaskinen om hjelp til å trene maskinlæringsalgoritmen. Når vi er fornøyd med å trene opp algoritmen, ønsker vi å benytte resultatet i en generalisering. Når vi slipper til nye rådata, kan vi forutsi utfallet. Dette kan eksempelvis være å avdekke mulig svindel eller varsle mulige allergireaksjoner i pollensesongen før hendelsen inntreffer. Maskinlæring tar oss fra det reaktive til det proaktive. Forsøket på kredittkortsvindel ble stoppet og pollenangrep basert på lokale mikroklima/miljøforhold varslet.

Maskinlæring hjelper oss m.a.o. ord å automatisere modellbyggingsprosessen og innsamlingen av viten. Dette lærer vi interaktivt gjennom at rådata gradvis viser oss skjulte mønstre, som deretter hjelper oss å predikere resultater med et minimum av manuell innsats. Når vi avslutningsvis skal velge beste algoritme og parametere handler det mye om innsikt i sannsynligheter knyttet til falske negativer og falske positiver.

Maskinlæring og mønstergjenkjenning
I illustrasjonen under har vi vist noen områder hvor våre brukere benytter maskinlæring og mønstergjenkjenning. Noen av disse systemene er bygget rundt ledet læring der vi har god tilgang på treningsdata, slik som i forrige eksempel. Vi ser imidlertid at i noen bransjer er det tradisjonelt vanskeligere å skaffe treningsdata. Dette kan for eksempel være når driften må stanses for å kopiere ut treningsdata eller at det rett og slett er få forekomster av positive utfall blant millioner av transaksjoner. Eksempel på dette er påviselig bankkortsvindel. I slike tilfeller hjelper vi virksomhetene med å se på andre alternativer, blant annet det vi kaller semi-ledet eller ikke-ledet læring. Trening av samspill mellom robot og realtidsanalyse i pasientdialogen er et eksempel på dette.

Illustrasjon av maskinlæring og mønstergjenkjenning. — *Illustrasjon av maskinlæring og mønstergjenkjenning*.

Flere eksempler på maskinlæring
La oss se på noen andre eksempler med SAS og maskinlæring:

Myndighetene i en av verdens største økonomier hadde sett seg lei på at det i praksis var umulig å få tilbake penger som er utbetalt gjennom svindling. Det ble derfor implementert realtidsanalyser bygget på maskinlæring som stopper høyrisikoutbetalinger før de gjennomføres.
En global teleoperatør så betydningen av å innføre nytt system for kundeanalyse basert på maskinlæring. Systemet beregnet løpende risiko for kundeflukt basert på et sanntidsbilde av kunden, bevegelsene i markedet og at kundens ytringer kunne fanges opp i tidligst mulig i forkant.
En stor internasjonal bank implementerte risikobaserte maskinlæringsrutiner for å kunne forutsi sannsynlighet for mislighold, sannsynlighet for tap i banken og gi raskt innsikt i porteføljepåvirkningen, på tvers av alle de forretningsområder hvor kunden hadde eller søkte engasjement.

Hvor tar maskinlæring oss videre?
I dag investeres det enorme beløp for å tette hullene og bygge bredere bro mellom maskinlæring og kunstig intelligens. Selv om vi nesten daglig hører om fremskritt som prosjektene i Googles X forskningslaboratorier med sjåførløse biler og hjelpsomme roboter, har vi fortsatt begge beina stort sett plantet i maskinlæringsdelen. Vi venter fortsatt på det neste store skiftet når maskinene klarer å differensiere det egentlige proaktive mønstret i våre aktiviteter og kalkulere våre behov før de faktisk inntreffer, og for oss uten at vi legger merke til det. Vi ser spirene til å finne disse nøklene som kan låse opp dette enorme potensialet bl.a. i NASA’s Future Engineers program og i EU’s Future & Emerging Technologies programmer.

Avslutningsvis må det sies at i sin enkelthet handler maskinlæring fortsatt om tre basale pilarer; algoritmer, data og regnekapasitet. Vi i SAS Institute ser store endringer innen alle disse tre områdene og tror at vi vil få se mye spennende innen bl.a. kognitiv analyse.

Er du interessert, kan du lære mer om hvordan maskinlæring påvirker hvordan vi ser på bruken av Analytics. Se on-demand webinar.

1 Comment

Harald Opdahl on 18 October 2016 11:10 am

Bra post, Inge! Altfor mange skriver bare om demarkasjon mellom tradisjonell stat og ML, mens vi burde konsentrere oss om avmystifisering, integrering og synergi. Det er mye kompetanse og ressurser på disse automagiske verktøyene, og til alt overmål: Kundene våre modnes merkverdig raskt ift bruk av ML!

Blogs

Blogs

Maskinlæring konkurrerer ut klassisk analyse

About Author

1 Comment

Leave A Reply Cancel Reply