Bedrijven worstelen met de enorme hoeveelheid data die te groot lijkt om op een efficiënte manier te verwerken of op een betekenisvolle manier in te zetten. Belangrijkste les is dat de klassieke principes voor goed informatiebeheer ook in de big data wereld gelden die de industrie ons vandaag de dag voorspiegelt. Het draait bij analytics net als voorheen in essentie nog steeds om de zoektocht naar waardevolle informatie.

 

Het goede nieuws over big data is dat de analytics mogelijkheden sterk verbeterd zijn en door een relatief lage prijs voor een veel grotere groep bedrijven beschikbaar zijn gekomen. Het slechte nieuws is dat de meeste organisaties die deze technieken zijn gaan toepassen meteen al uitglijders hebben gemaakt. Belangrijkste struikelblok is dat het bijzonder lastig is om meerwaarde uit de sterk gegroeide hoeveelheid informatie te peuren, die ook nog eens met een hoge omloopsnelheid op je af komt. “Die uitdaging los je niet in één dag op”, zegt Kas Kasravi, extra ordinary fellow binnen de enterprise service group van HP. In januari was hij een aantal dagen in Nederland om bedrijven bij te praten over wat hij noemt ‘big data analytics’.

Kasravi is wat je toch wel een veteraan mag noemen in het domein van analytics. In de jaren negentig was hij bij EDS destijds onderdeel van autofabrikant GM actief in het vakgebied van de informatie optimalisatie. Bij GM spoorde de van oorsprong in de kunstmatige intelligentie opgeleide analytics expert met state-of-the-art onderzoek in de bedrijfsdata de oorzaak op van problemen met de lak van auto’s. Ook al heeft hij er zelf met deze destijds opvallende implementatie misschien aan de basis gestaan met het hypewoord big data heeft Kasravi niet zoveel. “De nieuwe datasets als social media en tal van andere ongestructureerde databestanden doen het lijken alsof er momenteel een heel ander vakgebied is ontstaan. De probleemstelling mag dan door het voortschrijden van de technologie veranderd zijn, toch zijn de klassieke principes voor goed informatiebeheer nog steeds gewoon van toepassing. Dat wil zeggen dat de antwoorden die je probeert te vinden gewoon moeten aansluiten op de bedrijfsdoelstellingen. Daarnaast moet de exercitie beter beheersbaar worden door focus en prioritering en er moet door de hele organisatie heen draagvlak en inzet zijn voor het gegeven dat juist door onderzoek en analyse van informatie de organisatie verder kan komen.”

In memory
Begrijp hem niet verkeerd: Kasravi vindt dat er op dit moment wel degelijk revolutionaire verbeteringen plaatsvinden in de technologie. Een van de belangrijkste voorbeelden vindt hij in-database analytics en in memory databases waarmee organisaties hun analysehulpmiddelen direct op de productiedata kunnen richten. Over niet al te lange tijd zijn datawarehouses daardoor een stuk minder belangrijk. Tegelijkertijd is ook de economische context veranderd. Door de mondialisering en digitalisering van de economie behoort achteroverleunen tot het verleden. Als jouw organisatie het niet goed doet, word je ingehaald door de concurrent stelt Kasravi. Om die reden moeten organisaties de tijd die ligt tussen het inzicht en het moment dat je in actie komt verkleinen. Dat kan in Kasravi’s ogen alleen door analytics op een veel hoger plan te brengen en een deel van de besluitvorming te automatiseren.

Het woordje in de term big data, dat Kasravi het meeste aanspreekt is ‘big’. En dan heeft hij het niet zozeer over grote datavolumes of de diversiteit aan databronnen. De expert stelt ‘big’ vooral tegenover de nu gangbare praktijk om analytics vooral kleinschalig in de organisatie te beleggen. Vaak ligt analytics nu bij een persoon of een team. In de huidige exercitie die de beslistijd moet verkorten door de invoering van autonome systemen is die aanpak niet langer afdoende. De hele organisatie en de hele bedrijfsvoering moet met analyse en onderzoek bezig zijn om ervan te kunnen profiteren. Dat moet dan wel gebeuren vanuit een business gerichte insteek. De CIO die zal zeggen dat Hadoop een vette technologie is en om die reden de technologie uittest, zal niet verder komen met zijn exercitie. De CIO die zegt dat big data de moeite waard is omdat de organisatie daarmee sneller betere besluiten kan nemen zit wel op het goede spoor. Voor de rest is het vooral een kwestie van gangbare best practices rond informatie management hanteren. Voor Kasravi zijn een goede informatiehygiëne en genoeg budget reserveren voor het prepareren van data voor analyse de belangrijkste. Ook met de huidige technologie is het verzamelen en klaarzetten van data nog steeds 50 tot 90 procent van de inspanning.

Tot slot benadrukt de veteraan in het analytics vakgebied dat het net als voorheen zaak blijft om de ogen en oren goed open te houden om onbedoeld en als door het toeval op goud te stuiten. “Het begrip serendipiteit speelt een niet te onderschatten rol in de zoektocht van organisaties”, aldus Kasravi. “Als je teruggaat naar de etymologie van dit woord dan is de Britse auteur Horace Walpole de eerste die het in de achttiende eeuw gebruikte om het talent om toevallige ontdekkingen te doen te omschrijven. Het woord komt uit een Perzisch verhaal over drie prinsen die in de Serendip-streek in India met hun paarden onbekend terrein verkenden en tal van ontdekkingen deden. In het analytics vakgebied is het de vaardigheid om data te onderzoeken en er waardevolle informatie uit te destilleren waarvan je van tevoren nog niet wist dat je het had. Ik kan de waarde hiervan het beste illustreren aan de hand van een voorbeeld. Enkele jaren geleden terug vroeg een verzekeraar ons om te onderzoeken of we de bestaande datawarehouse in zouden kunnen zetten voor fraudebestrijding. Het vermoeden bestond dat er regelmatig uitgebreide garantieregelingen werden afgesloten na grote reparaties, terwijl dit volgens de polisvoorwaarden verboden is. Bij de analyse van de data kwam ik een veld tegen waarin klachten van klanten ingevoerd werden, dat iedereen over het hoofd had gezien. Dat stelde ons in staat om veel meer inzicht te krijgen in klanttevredenheid in de verschillende Amerikaanse staten. Zo bleek in Georgia veel meer klachten binnen te komen over remblokken, terwijl er in Michigan vooral klachten waren over de helpdeskmedewerkers.”

Hoger plan
Wat de toepassing van analytics in ieder geval op een hoger plan kan brengen, is het feit dat steeds meer organisaties een analytics platform als een dienst afnemen. “Waar het draait het om in de gezondheidszorg?”, vraagt Kasravi. “Toch vooral dat je zoveel mogelijk patiënten zo goed mogelijk wilt behandelen. Niet om het feit of zo’n instelling zijn analytics proces tot in de puntjes op orde heeft. Door het verzamelen en het beheer van die informatieberg als dienst af te nemen, kunnen organisaties zich vooral concentreren op de kwestie hoe zij hun vinger op waardevolle informatie kunnen leggen en dit gebruiken om beter te presteren. Waar ik zelf goede voorbeelden van heb gezien is dat analysetechnieken die zogenaamde data scientists toepasten in de ene industrie introduceerden in een ander zakelijk domein. Neem bijvoorbeeld het genetisch onderzoek, die veelgebruik maken van ‘sequence analyses’. Dit – sequence analysis – is als geen ander een techniek dat in andere industriën veelbelovende innovatie kan doorvoeren.”