KerData gère des milliards d’octets
Actualité
Des milliers de noms, autant d’adresses et de numéros de téléphone. Un fichier clients peut vite atteindre un volume astronomique de l’ordre du pétaoctet (un million de milliards d’octets).
À l’Inria, l’équipe de recherche KerData, présentée à l’assemblée générale du pôle Image et Réseaux, le 6 avril, se penche depuis juillet dernier sur la gestion de ces données gargantuesques.
« Les systèmes de stockage classiques dupliquent souvent les données, afin de pouvoir écrire sur l’une des copies – entrer les mises à jour par exemple – et lire les données sur l’autre. Cela double l’espace nécessaire ! D’autres systèmes bloquent l’écriture pendant la lecture et vice-versa, avec une baisse de performance. Notre méthode consiste à exécuter ces deux tâches en même temps, sur les mêmes données. » Lors des tests préliminaires, les techniques développées par KerData se sont montrées plus efficaces que la plate-forme Hadoop développée par Yahoo!, qui fait office de référence pour le traitement massivement parallèle des données à l’heure actuelle : le gain en temps de lecture est de l’ordre de 30% ! « Nous voudrions intégrer notre solution dans les plates-formes de cloud computing, qui louent de l’espace à distance pour stocker et traiter des données. »
Gabriel Antoniu
Tél. 02 99 84 72 44
Gabriel.Antoniu [at] inria.fr (Gabriel[dot]Antoniu[at]inria[dot]fr)
TOUTES LES ACTUALITÉS
du magazine Sciences Ouest