On appelle big data, données massives ou encore mégadonnées, les quantités astronomiques de données produites par les individus de nos jours quotidiennement.
Ces données représentent un gros volume, peuvent être analysées en temps réel par des algorithmes, sont très variées et ont une grande valeur pour ceux qui les analysent et les utilisent.
Cependant, lorsque le traitement porte sur des données liées à des personnes, le droit à la sphère privée et la protection des données personnelles doivent être garantis.
Les lois sur la protection des données s'appliquent aux données personnelles mais pas aux big data qui sont des données anonymisées. Le problème vient du fait que le recoupement de données peut de nouveau les rendre identifiables. On parle de ré-identification ou de dé-anonymisation.
Ces données proviennent souvent de sources plurielles et sont exploitées dans un but qui n'est pas celui qui a été prévu à l'origine.