Le saviez-vous ? On estime que les données numériques produites dans le monde pour les seules années 2019 et 2020 équivalent à 95% de la masse d’information produite au cours de toute l’histoire de l’humanité ! Et la tendance n’est pas prête de s’inverser. L’émergence de ces données massives a entraîné l’apparition d’un nouveau concept, appelé le « Big Data ».
Le Big Sata désigne moins une notion qu’un phénomène : celui de l’augmentation exponentielle du volume des données produites par les nouveaux médias numériques, stockées dans des serveurs de plus en plus imposants. En rédigeant un tweet ou un commentaire sur Facebook, en lançant une requête sur Google, en partageant une image sur FlickR, en effectuant une démarche administrative en ligne ou tout simplement en naviguant de site en site, l’internaute moyen produit quotidiennement et sans en avoir conscience une masse très importante de données, qui sont précieusement conservées par les applications et les sites utilisés. La diversification constante des usages d’Internet, l’augmentation du nombre d’utilisateurs à l’échelle planétaire et le perfectionnement des algorithmes ne vont faire que renforcer le processus au cours des années à venir.
Pourquoi les géants du web dépensent-ils des fortunes en matériel informatique et en consommation d’électricité pour stocker le Big Data ? Tout d’abord parce que ces données, à bien des égards, valent de l’or : elles se révèlent précieuses par exemple pour réaliser des études statistiques ou comportementales à très grande échelle, ou encore pour d’autres visées scientifiques (étude de la propagation d’une épidémie, d'un mouvement de panique économique, de la climatologie…). Surtout, le profil détaillé des internautes eux-mêmes (habitudes, goûts et intérêts…) représente une masse de données convoitée par les entreprises commerciales du monde entier, pour maximiser leurs chances de vendre le bon produit à la bonne personne.
Face à la masse que représente le Big Data, les logiciels traditionnels de gestion de bases de données se révèlent bien vite inadaptés et sous-dimensionnés. La conception de nouveaux outils puissants et d’algorithmes toujours plus intelligents constitue donc un enjeu important pour le secteur des technologies de l’information. Au-delà, les internautes peuvent légitimement se sentir concernés, en tant que citoyens, par l’exposition croissante de leur vie privée, ce qui pourrait faire du Big Data une thématique fondamentale du débat public dans les années à venir. Dans tous les cas, les experts s’accordent à dire que le phénomène n’en qu’à ses débuts : les applications du Big Data, tout comme d’ailleurs ses implications, ne sont encore connues que de façon très embryonnaire !