Les BIG DATA

Tout les jours, nous générons 2,5 trillions d’octets de données. Ces données proviennent de partout : de capteurs utilisés pour collecter les informations climatiques, de messages sur les sites de médias sociaux, d’images numériques et de vidéos publiées en ligne, d’enregistrements transactionnels d’achats en ligne et de signaux GPS de téléphones mobiles… . Ces données sont appelées Big Data ou volumes massifs de données. Quel est l’utilité des Big Data ? Par exemple, en renseignant à la fois les habitudes alimentaires et les différents problèmes de santé d’une personne, l’ordinateur pourrait prédire en quelques secondes quand interviendra une éventuelle attaque cardiaque. Le concept s’applique aussi aux commerçants qui pourraient proposer des promotions personnalisées en fonction des précédents achats aux éventuels clients qui passent devant leurs boutiques.

Fonctionnement : les Big data regroupent trois types d’architectures :  décisionnelle, in memory et massivement parallèle. Chacune d’elle traite les données différemment. L’architecture décisionnelle s’occupe plus aisément du transfert de données, et est moins performante lors du traitement. L’architecture in memory, quand à elle, est optimisé pour la mises à jour des données. Enfin, l’architecture massivement parallèle, son fonctionnement est basé sur la colocalisation des données. C’est-à-dire qu’elle est basée sur les traitements de données.

Focus sur Facebook. Facebook possède un moteur de requête en SQL nommé Presto. Ce moteur de requête est 10 fois plus performant que celui de HIVE, son ancien moteur. Presto a été conçu par les ingénieurs de Facebook afin de gérer au mieux les requêtes, qui avant avaient un problème de latence car dans leurs entrepôts, résident plus de 300 PetaOctets (10^15 octets). C’est un outil Open Source sous licence Apache 2.0, son code est donc libre d’accès. Son intéret est de cibler les centre d’intérêts des utilisateurs afin de leur proposer des pub « personnalisées ».

Auteurs :

Arnaud ROYER

Erwan GEYVELIAN

Thomas GIANGRANDE

 

Ce contenu a été publié dans Veille technologique. Vous pouvez le mettre en favoris avec ce permalien.