Big data is hot. Op radio, online en op papier wordt veel geschreven over big data. Heel veel van die verhalen gaan over de mogelijkheden van big data. Deze mogelijkheden liggen op verschillende gebieden. Zo kondigde de ING vorige week aan om betaalgegevens van klanten te gaan analyseren om persoonlijke aanbiedingen te kunnen doen. In de volkskrant las ik een artikel over het gebruik van big data in de zorg, waarbij met behulp van big data ernstige aandoeningen eerder opgespoord kunnen worden.
De indruk ontstaat dat de mogelijkheden van big data onbeperkt zijn. Door gebruik te maken van slimme computerprogramma’s kunnen snel verbanden in grote datasets ontdekt worden èn kunnen persoonlijke ‘adviezen’ gegeven worden. Hierbij worden interessante nieuwe methodieken gebruikt die een grote aanvulling zijn op de traditionele statistiek die ik ooit geleerd hebt. Er hoeft niet meer gewerkt te worden met bijvoorbeeld valide steekproeven, maar de hele dataset kan in totaliteit geanalyseerd worden (inclusief de vervuiling in de dataset).
Wat is de andere kant van big data waar ik in de titel van deze blog op doel? De andere kant van big data is de kant van het verzamelen van data. Als je betekenisvolle informatie uit gegevens wilt gaan halen met big data technieken zal je wel eerst de data moeten gaan verzamelen en vastleggen. Niet iedereen is in het bezit van gegevens van miljoenen klanten zoals banken.
Wordt het tijd je zorgen te gaan maken als je nog geen enorme grote hoeveelheden data tot je beschikking hebt?
Hoe kom je aan waardevolle gegevens die je nieuwe inzichten gaan opleveren? Moet je apps laten ontwikkelen die gegevens van je klanten vastleggen, moet je social media data gaan verzamelen, moet je sensoren in systemen bouwen die van alles en nog wat registreren?
Het verzamelen van (veel) gegevens is geen doel op zich, volgens mij is big data vooral een andere kijk op informatie, waarbij je gebruik maakt van de huidige ICT mogelijkheden. Een mooi voorbeeld las ik al weer enige tijd geleden in de computable. Hier werd verwezen naar de manier waarop de NS data gebruikt voor het communiceren over de bezettingsgraad van treincoupés. De bezettingsgraad wordt niet meer op de traditionele manier voorspeld op basis van historische steekproeven. Nu wordt dit gedaan aan de hand van camerabeelden waarmee te zien is hoeveel mensen er op elk moment daadwerkelijk in de trein zitten. Deze informatie wordt vervolgens gebruikt in de NS-app om informatie te leveren over de daadwerkelijke bezettingsgraad. De klant kan dan kiezen om te gaan staan of een volgende trein te nemen.
Als je met big data aan de slag wilt gaan, denk dan eerst na over de vraag wat informatie voor uw organisatie betekent. Kies vervolgens de juiste aanpak en methodiek(en) en zoek hier vervolgens slimme oplossingen bij. Zaken als bijvoorbeeld privacywetgeving dienen hierbij zeker niet over het hoofd gezien te worden.
We helpen u graag bij het nadenken over, en het organiseren van uw informatie.
Svenja welkom bij ons team!
03-02-2025 - Svenja Wetzker
Mijn naam is Svenja Wetzker en ik ben net gestart bij InnoviQ. Een uitdaging waar ik mega enthousiast over ben en heel veel zin in heb! Ik zal jullie in deze blog even kort iets over mij vertellen en...
Een nieuw jaar en een nieuwe jubilaris
23-01-2025 - William van Grieken
Mathilde van harte gefeliciteerd met je 5-jarig jubileum bij InnoviQ! Een moment om trots op te zijn. Na een tijd in het buitenland heb je je hier weer helemaal bewezen, en diverse mooie projecten...
Wij verwelkomen Arjen Eerbeek!
16-01-2025 - Arjen Eerbeek
De jaarwisseling van 2025 markeert voor mij niet alleen een nieuw jaar, maar ook een nieuwe start bij InnoviQ. Mijn naam is Arjen Eerbeek en woon samen met mijn vrouw en kind in het midden van het...