Data kan användas till att frigöra tid, effektivisera, och förbättra processer – och även till att skapa nya affärer. Genom att evaluera era datadrivna förbättringsprojekt med 15 specifika frågor kan mycket frustration och ovälkomna bakslag undvikas och möjligheterna att lyckas hela vägen ökas betydligt.
Vi har tidigare skrivit om varför det är så viktigt att först identifiera behov, problem och utmaningar som är värda att lösa, och dessutom att avgränsa projekt som ger snabbt och tydligt värde tillbaka, för att undvika att mycket resurser plöjs in ett svart hål och där allt rinner ut i sanden på grund av komplexitet.
När projektet väl är definierat krävs att se över hur mogen organisationen är att genomföra projektet, utifrån ett dataperspektiv.
– Genom att ställa frågorna får projektägare en fingervisning om vilka avdelningar som behöver vara med på resan. Ofta omfattar nya dataprojekt fler aspekter av verksamheten och av organisationen än man först tänker på. Det är bra om de olika berörda personerna kommer på banan tidigt, säger Stella Riad, enhetschef på RISE.
Kastar ljuset på nuläget och utmaningarna
Metoden är till för att snabbt få svar på frågan: Var står vi någonstans?
Och framför allt, vilka milstolpar måste projektet passera för att komma vidare?
– De 15 frågorna är en praktisk tillämpning av Neil D. Lawrences forskning om ”data readiness levels” som gör att man får igång en nödvändig diskussion om projektet ur olika synvinklar.
De olika datamognadsnivåerna kallas i forskningen band C, band B och band A:
- Band C handlar om datans tillgänglighet. Existerar datan? Får den användas?
- Band B handlar om datans tillförlitlighet. Är den validerad?
- Band A handlar om datans användarbarhet. Kan datan göra nytta?
Varje nivå kastar helt enkelt ljus på olika utmaningar, och genom de 15 frågor som RISE har tagit fram, blir ni medvetna om parametrar som annars är lätta att missa.
– Det bästa är om alla berörda personer och avdelningar går igenom frågorna under ett Teams-möte på 1-2 timmar. Det kommer ni att vinna mycket tid på. Vi hade exempelvis ett case nyligen där ingen hade tänkt på att viss information kunde vara känslig. Ju tidigare sådant blir känt, desto bättre.
Genom att ställa frågorna får projektägare en fingervisning om vilka avdelningar som behöver vara med på resan
Frågor för ”band C” (tillgänglighet av data)
Har ni programmatisk åtkomst till data?
Kan era utvecklare komma åt den via till exempel ett API eller databas?
Har ni de licenser som behövs för att använda data?
Om ni köper in data från tredje part är det viktigt att ni säkerställer att licensen, och terms of service, täcker ert användningsfall. Det kan till exempel vara stor skillnad på hur man får använda samma data i en akademiskt sammanhang och i ett kommersiellt dito.
Har ni säkerställt att ni har juridisk rätt att använda data?
Är frågor som t.ex. GDPR hanterade?
Har ni utfört en etisk analys av användandet av data?
I vissa fall behöver man göra en etisk prövning för att få använda data i forskningssyfte. Konsultera en jurist om ni är osäkra. Mer finns att läsa hos Etikprövningsmyndigheten.
Är data konverterat till ett maskinläsbart format?
För att kunna använda data i en automatiserad process, så behöver data vara läs- och hanterbart för de program som ska utföra processen. Exakt hur data bör vara formaterat beror av de verktyg som ska använda data. Om man till exempel tänker använda metoder för automatisk språkanalys (det som kallas ”Natural Language Processing, NLP”, på engelska), så behöver de dokument man ska analysera vara konverterade till maskinläsbar text.
Frågor för ”band B” (tillförlitligheten av data)
Är datas karaktäristik kända?
Har någon utfört exempelvis en explorativ dataanalys, eller har ni tittat igenom exempel från datamängden för att säkerställa att ni har en känsla för dess egenskaper och brister?
Är data validerat?
Har den rensats från duplikat, har saknade värden hanterats mm?
Frågor för ”band A” (användbarheten av data)
Är alla intressenter överens om användningsfallet vilket data är avsedd att lösa?
Band A är, som sagt, starkt knutet till den uppgift som ska lösas. Den första och kanske svåraste frågan för ett nytt projekt är att komma överens om vilket behov projektet är satt att lösa.
Är alla intressenter överens om syftet med att använda datat?
Först när behovet är identifierat, så kan man börja fundera på hur en lösning kan se ut. En del av lösningen är data; vet de inblandade intressenterna varför (det vill säga hur) datat kan vara en del av lösningen? I svaret på den frågan ingår också ett tydliggörande av de förväntningar man har på data, till exempel i termer av tillgänglighet/åtkomst, format, latens mm.
Är datat tillräckligt för att lösa användningsfallet?
Dvs. är den data som projektet har tillgång till tillräcklig för att ta realisera den eller de lösningar på behovet man har kommit fram till? Finns det till exempel annoterad träningsdata av lämplig mängd och kvalitet?
Är data tillräckligt för att utvärdera en lösning av användningsfallet?
Det vill säga, finns det lämplig validerings- och utvärderingsdata? Eller finns det andra sätt att utvärdera lösningen?
Är organisationens datainhämningsprocesser sådana att de stödjer inhämtning av ny data av samma slag som ni använder i det här projektet?
Ett projekt leder ibland till en tjänst som ska produktionsättas och förvaltas; kan organisationen som ska utföra dessa steg säkerställa att ny (och framtida) data hämtas in och hanteras på ett sådant sätt att tjänsten kan fortleva. Till exempel kan organisationen konvertera inkommande rapporter från PDF till lämpligt textformat, eller säkerställa att de mätpunkter från de sensorer som använts i projektet motsvaras av de som används i produktionsmiljön?
Är er data säkrad med avseende på datorintrång och affärsrisker?
Data ska inte bara vara tillgänglig för deltagare i projektet, det bör också säkerställas att den inte är tillgänglig för obehöriga användare. Ni behöver proaktivt arbeta för att minimera riskerna för datorintrång, samt ta fram handlingsplaner som talar om för organisationen hur den ska agera i den händelse datorintrång sker. Det här är sällan något som ligger inom ramen för ett enskilt projekt.
Är det säkert för er att dela data med andra (med avseende på affärsrisk)?
I den mån ni vill dela med er av data, så behöver ni ställa er frågan om huruvida det är säkert att göra så med tanke på den affär ni (potentiellt sett) kan göra med data; ger delningen av data oavsiktlig information om era förmågor och framtida affärsplaner?
Får ni dela data med andra, med tanke på t.ex. licenser och GDPR?
I den mån ni vill dela med er av data, så behöver ni säkerställa att ni faktiskt får det med hänsyn till exempelvis GDPR och de licenser och villkor som hör till eventuell data från tredje part.
Ta gärna hjälp av vår expertis och erfarenhet
Om er organisation vill dra nytta av RISE erfarenhet av att hjälpa organisationer genom den här processen, hör av dig direkt till oss.