BigDatamaandag deel 1: Wie, wat, waar en wanneer?

Legal tech - ictprivacyrecht - Privacy / 7 July 2014

Big Data, het begrip waar eindeloos over wordt geschreven en gediscussieerd. Hype of toekomst? Toekomst of realiteit? Wat de speculaties ook zijn, de komende weken zal er een blogserie over Big Data en de juridische impact ervan verschijnen. Want hoewel het combineren van enorme datasets wellicht in eerste instantie onschuldig lijkt, heeft dit wel degelijk juridische gevolgen wanneer deze data ook informatie over personen bevat.

Omdat dit deel een van deze blogserie is, lijkt het mij verstandig met een luchtig onderwerp te beginnen. Want we horen veel over Big Data, maar wat ís het nou eigenlijk? En wie maakt er al gebruik van Big Data?

Vaak worden er drie ‘basis’ eigenschappen genoemd welke Big Data omschrijven, de zogenaamde drie V’s. Deze drie V’s zijn:

Volume: deze eigenschap ziet op de hoeveelheid data welke verzameld wordt. Deze hoeveelheid groeit gestaag, mede omdat het opslaan van data steeds goedkoper wordt. Hierdoor is het niet meer nodig data te verwijderen, en gebeurt dit ook maar zelden.
Variety: deze eigenschap ziet op de verschillende soorten data die opgeslagen wordt. Denk hierbij bijvoorbeeld aan tekst, foto’s op Facebook, gênante Youtube fimpjes en zelfs vingerafdrukken die Apple in zijn bezit heeft dankzij de nieuwe iPhone 5s.
Velocity: deze derde eigenschap ziet op de snelheid waarmee data wordt gecreëerd. (leuk weetje: 90 procent van de opgeslagen data is in twee jaar tijd ontstaan!)

Er is veel mogelijk met Big Data en hierdoor wordt er niet één strikte definitie gehanteerd om Big Data te omschrijven. Aangezien ik begrijp dat dit het er niet bepaald eenvoudiger op maakt, gebruik ik de volgende definitie om Big Data te omschrijven:
‘Het combineren en analyseren van verschillende databases afkomstig uit verschillende bronnen, of het analyseren van een grote hoeveelheid data door een instantie met als doel hier voordeel uit te behalen in de zin van bijvoorbeeld tijdsbesparing, winst, of innovatie.’

Met vele verschillende mogelijkheden van Big Data op het commerciële vlak hebben wij zelf dagelijks te maken. Zo kan Big Data gebruikt worden voor profilering. Door het combineren van gegevens uit verschillende bronnen, zoals bijvoorbeeld leeftijd, adres en aankoophistorie, kunnen er gerichte advertenties gestuurd worden. Deze analysetechnieken zijn zelfs zo geavanceerd dat ze zelfs weten te voorspellen wanneer iemand zwanger is, wat soms ongemakkelijke situaties kan opleveren.

Na de onthullingen van Edward Snowden bleek dat Big Data niet alleen voor het aanbieden van leuke koopjes gebruikt wordt. De overheid blijkt ook fanatiek gebruik te maken van Big Data. Door het verzamelen van oneindig veel data uit verschillende bronnen en hier analysetechnieken op los te gooien, wordt er onder andere geprobeerd terrorisme te bestrijden. Tevens wordt Big Data ingezet om sneller en beter in te grijpen bij een economische crisis.

Tot slot, om toch nog een juridische draai aan deze introblog te geven, een derde voorbeeld waar Big Data voor gebruikt kan worden. Big Data wordt namelijk ook ingezet om procedeerkansen te voorspellen. Het programma Juristat is voor en door advocaten ontwikkeld. Aan de hand van Big Data analyses kunnen er voorspellingen worden gemaakt over welke weg de rechter in een bepaalde situatie zal volgen. Volgens Juristat maken advocaten meer kans een zaak te winnen indien zij deze analyses aanhouden.

Het is duidelijk dat Big Data vele mogelijkheden biedt. Doordat Big Data steeds vaker wordt toegepast zijn er ook een aantal valkuilen waarmee rekening gehouden moet worden. Hierover volgende week meer.