big-data-big-stars-674x225

Mijn kijk op Big Data uitdagingen

Ik ben werkzaam in de IT-sector sinds 1978 en gedurende deze tijd heb ik vele hypes de revue zien passeren – maar niet alle hypes zijn erin geslaagd om ook daadwerkelijk te voldoen aan de aanvankelijke verwachtingen. Dat gezegd hebbende, de ‘buzz’ omtrent Big Data behoort duidelijk tot één van de grotere. Het spreekt voor zich dat met de juiste toepassing, Big Data kan zorgen voor verschillende competitieve voordelen. Alhoewel ik wel de neiging heb om met mijn wenkbrauwen te fronsen als ik lees dat Big Data dé oplossing voor elke industrie zou zijn. Ik denk namelijk dat het nog wel een hele tijd gaat duren voordat Big Data een groot succes gaat worden…

Big Data zou in de ‘Top 10 CIO concerns for 2016’ moeten staan, denk je niet?

De Amerikaanse sociëteit voor Information Management heeft een onderzoek gepubliceerd getiteld ‘The Top 10 CIO concerns for 2016', waar de mogelijkheden om de Big Data belofte te ontplooien geregeld in terugkomen. Ik had daarom verwacht Big Data initiatieven te zien als één van de grootste zorgenkindjes van de CIO, desondanks wordt dit niet expliciet vermeld. Het onderzoek is gebaseerd op een enquête onder 785 organisaties en leverde de volgende top 10 op: 

  • Alignment of IT with the Business
  • Security and Privacy
  • Speed of IT Delivery and Time-to-Market
  • Innovation
  • Business Productivity and Efficiency
  • IT Value Proposition to the Business
  • IT Agility and Flexibility
  • IT Cost Reduction and Controls
  • Business Agility and Flexibility
  • Business Cost Reduction and Controls

 

Zoals u kunt zien focust deze lijst zich voornamelijk op het verbeteren van de agility en flexibiliteit van organisaties en een betere samenwerking tussen de business en IT. De lange doorlooptijden van IT leveren vaak frustraties op voor de business, die afhankelijk is van IT om antwoorden op hun vragen te vinden. Vanuit dat oogpunt is het dus begrijpelijk dat dit op nummer 1 staat.

Ook al zou je kunnen discussiëren dat Big Data onder de ‘Innovatie’ categorie valt, feit blijft dat IT-afdelingen normaliter 95% van hun budget spenderen aan enkel het behouden en laten draaien van de huidige activiteiten, waardoor er weinig overblijft voor innovatieve aankopen. Als Big Data zo hot is, waarom zien we dit dan niet terug op de lijst? Zijn de 785 organisaties wel representatief voor een statistisch onderzoek? Of zijn er nou eenmaal maar enkele Big Data initiatieven in omloop? Of zal het nog een paar jaar duren voordat we hier iets van gaan merken?

Gestructureerde data omzetten naar informatie is al vrij lastig…

Iedereen met oppervlakkige kennis van business en IT zal hebben gemerkt dat bedrijven over de hele wereld nog steeds worstelen om de belangrijkste informatie uit hun ERP systeem te krijgen. Dit is waarom de woorden alignment, speed, productivity, efficiency, IT value, cost, agility en flexibility voorkomen in bovenstaande lijst. ERP systemen bevatten gestructureerde informatie, opgeslagen in honderden tabellen en vele duizenden velden (de traditionele relatie gerelateerde databases). Gebrek aan data is hier niet het probleem, maar data complexiteit en toepassing van de logische complexiteit wel. De vraag die door mijn hoofd spookt sinds ik voor het eerst hoorde van Big Data is “hoe kan het toevoegen van meer ongestructureerde data aan het IT-landschap het antwoord zijn?” Dat is het gewoonweg niet.

In een SAP omgeving kan ik aantonen dat het mogelijk is om volmaakte end-to-end supply chain visibility en predictive analytics informatie te verkrijgen met minder dan 5% van de totale beschikbare opgeslagen data. Dat is niet meer data, maar een stuk minder; oftewel smart data. Het oude gezegde ‘work smarter not harder’ komt bij me op. Helaas is smart data, in het geval van SAP ERP, niet verkrijgbaar door een simpele klik op de knop. In het geval van Every Angle is dit wel mogelijk, het is het resultaat van vele jaren van analyses en ontwikkeling door een team van mensen met een volledig begrip van operations management, SAP data structuren en softwareontwikkeling.

Gesprekken die ik heb gevoerd met professionals binnen mijn persoonlijke netwerk hebben mij doen inzien dat het Big Data potentieel niet genegeerd mag worden. Een goed voorbeeld hiervan is een farmaceutisch bedrijf dat data verzamelt via social media om de medicatie en bijbehorende documentatie te verbeteren. Dit ‘zwembad van ongestructureerde data’ kan inderdaad veranderen in een ‘oceaan aan informatie’ indien de juiste tooling wordt toegepast, mits u weet waar u naar op zoek bent. De gemeenschappelijke noemer voor alle belangrijke succesverhalen die ik heb gehoord is dat business experts met een schat aan interesse en ervaring met informatiesystemen, oftewel de Data Scientists, overal werden aangenomen.

Als het omzetten van gestructureerde data naar actionable insight al lastig wordt gevonden, dan kan ik me voorstellen dat hetzelfde proces voor ongestructureerde data nog lastiger zal zijn en meer werk oplevert. Tenzij Big Data tools dit probleem dramatisch vereenvoudigen - waar ik helaas nog geen bewijs van heb mogen zien. Ik ben er daarom van overtuigd dat het nog een paar jaar gaat duren voordat we de ‘boom’ gaan zien.

Behoefte aan beschikbaarheid van Data Scientists

Data Scientists worden geacht data om te zetten naar informatie – maar is het een wetenschap om informatie uit data te halen? Jazeker…

Een uitmuntende Data Scientist excelleert de IT-ontwikkeling (datamodellering, data structurering, gegevensverwerking en coderingen) maar ook de statistieken (de wiskunde, methoden, patroonherkenning, etc.) en visualisatie methoden tot in de puntjes. Met de juiste tooling en technische kennis is het niet zo moeilijk om correlaties tussen statistische relaties aan te tonen. Maar statistische relaties zijn niet hetzelfde als causale relaties. Data die aantoont dat er een daling is in het aantal ooievaren en een andere set data die aantoont dat er een daling is in het aantal geboortes in een bepaalde regio, gedurende een bepaalde periode, kan aantonen dat er een correlatie is, maar er is geen sprake van een causale relatie. Nu ga ik er even vanuit dat iedereen op de hoogte is dat baby’s niet worden afgeleverd door ooievaren! De vaardigheid om een causale relatie aan te tonen is heel belangrijk en kan alleen worden bereikt met diepgaande domein kennis (oftewel business kennis) en een solide redenering.

Hoogopgeleide IT-experts hebben veel kennis van algoritmes, coderen, databases en staistieken, maar de experts die ook de onderliggende business logica begrijpen en goed kunnen communiceren met de business (door echt te begrijpen wat de what en why zijn van de vragen die gesteld worden) zijn de spreekwoordelijke naald in de hooiberg. Tamara Dull, Director of Emerging Technologies and Thought Leader bij SAS, beschrijft een dergelijk omnipotent expert als een eenhoorn. Of om meer precies te zijn: “een kwantitatief analist die precies die belangrijke naald in uw data hooiberg kan vinden terwijl hij een charismatische TED talk geeft.” Want laten we eerlijk zijn – goede Data Scientists zijn erg schaars. Je hebt veel tijd en een goed gevulde portemonnee nodig om iemand van het eerder omschreven kaliber te vinden. Dit is nog een reden dat de Big Data buzz met nog enkele jaren vertaagd zal zijn.

Mijn genuanceerde visie op Big Data

Het Big Data potentieel is zeker veelbelovend: krachtige Data visualisatie, Data discovery en Data verkenningstools zijn al beschikbaar. Hetzelfde geldt voor de in-memory technologie, wat nodig is voor high speed analyses en rapportages, en Agile Data extractie en Modellering, voor de altijd veranderende datastructuurbronnen en databron content. Echter, al deze nieuwe snufjes roepen om mensen die zijn gezegend met zowel technische als business kennis, wat helaas erg zeldzaam is en voorlopig ook zeldzaam zal blijven. Het is ook belangrijk om te weten dat geen van deze nieuwe technologieën zal worden aangemoedigd als het niet ondersteund wordt door de grote meerderheid van de C-suite.

Ik denk daarom dat het fair is om te zeggen dat ik op het moment nog geen Big Data aanhanger ben. Ik moet worden overtuigd door feiten, logica, observaties, tastbare klant cases en echte verhalen over de inspanningen en de kosten. Tot op heden is het bewijs schaars, net als de beschikbare Data Scientists.

Op woensdag 21 september zal ik een presentatie hosten op het Big Data Expo 2016 event, welke plaatsvindt in de Jaarbeurs in Utrecht. U kunt zich hier inschrijven voor een gratis full conference ticket. Mocht u openstaan voor een gesprek over Big Data, kom dan gerust naar de Every Angle stand (B42). Volg de geur van vers gebakken lolly wafels! 

Jacques Adriaansen
Business Improvement Thought Leader at Every Angle
j.adriaansen@everyangle.com

every-angle-rtlz