knowledge pyramidDeze post borduurt verder op mijn eerdere blog ‘Internet of Things’. Het verschijnsel dat steeds meer objecten aan internet verbonden (gaan) worden. Maar bovenop al deze sensoren die gegevens verzamelen komt ook nog al het verkeer op internet, sociale platformen, email correspondentie en zo verder.
Even een ruwe definitie van Big Data: ‘De collectie van data van traditionele en digitale bronnen die als startpunt dienen voor continue onderzoek’. Van N=150 naar N=Alles.  Twee grote trends komen samen.
We leven meer en meer in een zogenaamd ‘Digital Life’. Iedereen laat sporen achter die veelal niet meer kunnen worden uitgewist. Het is bekend naar welk museum (Facebook) je gaat, wat je bezig houdt (Twitter) en hoe je CV eruit ziet (Linkedin). Dan heb ik het nog niet over gegevens bij organisaties zoals je digitale dossier bij het ziekenhuis, de transacties op je rekening van de bank of de momenten dat je in- en uitcheckt met je ov chipknip.
De gerelateerde trend die daarbij samenkomt is die van ‘Big Data Research’. Eerder was er niet alleen minder informatie digitaal maar ook de computers zijn zo krachtig geworden dat het mogelijk is om gigantisch veel data te koppelen en te analyseren.
Deze analyse ondergaat nu een sterke vlucht. Belangrijk verschil met traditioneel onderzoek is tweeledig: Bij Big Data wordt zonder hypothese gezocht. Vroeger onderzocht men: ‘Toename van trainingsuren heeft positieve invloed op prestaties van de atleet in de hardloopcompetitie’. Nu worden gigantische datahoeveelheden ingeladen voor onderzoek. Bijvoorbeeld het weer van de afgelopen jaren, het aantal golden retrievers, cijfers over verkochte pakken afwasmiddel en het aantal gepleegde moorden. En dan maar kijken wat daar voor patronen zichtbaar worden. En dat is direct het tweede verschil. Vroeger was het belangrijk wat de causaliteit was. Welke oorzaak leidt tot welk gevolg? Bij Big Data wordt gefocust op correlatie en daarmee de mate van voorspelbaarheid. Een soort glazen bol. Klinkt dat wat vaag? Een paar voorbeelden:
Google heeft een real time griep tracker geïntroduceerd. Iedereen die zocht op bepaalde woorden als ‘griep’ werden geclusterd. Hieruit kun je opmaken waar een epidemie aan het ontstaan is.
Wal-Mart kwam erachter dat bij aankondiging van een storm de verkoop van zaklantaarns steeg. Best logisch natuurlijk maar ook de verkoop van Pop Arts (zoete ontbijtsnack) steeg sterk. Vanaf dat moment staan Pop Arts tussen de storm artikelen en is de verkoop geëxplodeerd.
Nog te ver van jouw bed? Verzekeraars zijn op dit moment aan het zoeken naar correlaties tussen profielen en de kans op ziekenhuis gebruik (dus claims en kosten). Straks zal het normaal zijn dat jij een hele andere premie betaalt dan je buurman.
Big Data kan veel voordelen opleveren, ook voor ons als consument. Denk aan wetenschappelijk onderzoek dat door beschikbaar komen van meer informatie sneller tot doorbraken zal leiden of aanbiedingen die nu wel echt op jouw situatie zijn afgestemd
Fit For Free
Het verbaast mij aan de andere kant hoe weinig mensen beseffen wat de negatieve consequenties van digital life kunnen zijn. Big Brother is watching. De gemiddelde Nederlander is net zo zorgvuldig met het achterlaten van gegevens als de directie van de Ibn Ghandoun school in Rotterdam met het geheim houden van eindexamens. Hoe zorgvuldig ben jij?
Nog even iets anders. De advertentie rechts wekte mijn verbazing, Fit For Free klinkt goed, maar dat voor 15,95 per maand?

1 antwoord

Reacties zijn gesloten.