Une image parmi des millions

N° 273 - Publié le 30 juillet 2014
© Nathalie Blanc
LAURÉAT :
Hervé Jégou.
Diplômé de l’École d’ingénieurs des mines de Saint-Étienne, il a travaillé deux ans chez Cap Gémini avant de reprendre ses études. Reçu à l’École normale supérieure, il a soutenu sa thèse en novembre 2005. Il est aujourd’hui en poste à l’Inria Rennes Bretagne Atlantique.
INTITULÉ DE LA THÈSE :
Codes robustes et codes joints source-canal pour transmission robuste sur canaux mobiles.

Il a appliqué un nouveau mode de compression numérique au domaine de la recherche d’images parmi une immensité.

Qui se souvient encore des joies des grésillements sur les lignes téléphoniques ? Même s’ils rendaient les conversations parfois difficiles, on entendait au moins une partie du message. Ce n’est plus le cas maintenant, avec les lignes numériques. Quand il y a un problème de transmission, aucune information ne passe : il n’y a plus de message du tout. D’où le casse-tête permanent des informaticiens, qui cherchent à trouver un compromis entre un codage des informations suffisamment puissant, pour arriver à faire face à l’augmentation du nombre de données à transmettre, et une bonne restitution du message initial.

Pour sa thèse réalisée de 2002 à 2005 à l’Irisa(1), Hervé Jégou a travaillé à la mise au point d’un nouveau type de codage, différent de celui basé sur les turbocodes, qui ont déjà fait la renommée de deux chercheurs bretons en 1991(2). « Il s’agit de codes conjoints, c’est-à-dire qui intègrent en même temps la compression et la correction du message, explique-t-il. L’idée est de pouvoir proposer une reconstitution utilisable du message d’origine et pas rien ! »

Une autre façon de chercher

Juste après sa thèse, Hervé Jégou a eu l’idée d’appliquer plusieurs techniques utilisées en compression à un domaine où elles n’avaient que très peu été exploitées : celui de l’indexation d’images, c’est-à-dire de la recherche d’une image parmi une immensité. Sur le principe des moteurs de recherche par mot-clé, dont l’utilisation sur Internet est aujourd’hui routinière : vous tapez votre mot et des références s’affichent à l’écran en quelques secondes. « La différence avec les images, c’est que la recherche n’est pas sémantique. Elle ne peut pas être interprétée. Le moteur doit pouvoir retrouver des éléments d’une photo même si le sujet est coupé, dégradé, caché par le brouillard... C’est vraiment une autre façon de chercher, basée sur une indexation multidimensionnelle. »

Le rond d’une arcade, un morceau de la tour..., même par temps gris, suffisent au moteur de recherche, développé par Hervé Jégou et ses collaborateurs, pour retrouver, parmi 10 millions d’images, celles qui correspondent à la requête de départ (photo du haut).
© Hervé Jégou

1 000 vecteurs, 10 millions d’images

La recherche est multidimensionnelle car l’image est décomposée en imagettes qui correspondent aux zones les plus caractéristiques : la forme d’un bâtiment, par exemple. Une image devient alors un millier de vecteurs, et ce sont ces vecteurs qui vont être comparés à ceux des 10 millions d’images dans lesquelles il faut chercher ! « Cette méthode n’est pas nouvelle, précise Hervé Jégou, mais elle est ordinairement très coûteuse en informations. Je l’ai adaptée à la recherche d’images en faisant un compromis entre la vitesse et la qualité du résultat. Et je me suis donc autorisé des approximations. » Mais le moteur fonctionne déjà très bien. Hervé Jégou, alors en poste à l’Inria de Grenoble, a publié et déposé un brevet pour son outil, appelé Bigimbaz. Et une start-up, Milpix, a été créée en 2007 par un de ses collègues pour le commercialiser. L’Inria a même présenté Bigimbaz à un concours international où il a obtenu de très bons résultats. Son premier domaine d’application concerne la recherche de copies, de photos piratées.

Hervé Jégou, lui, continue son bonhomme de chemin. Revenu à l’Inria de Rennes depuis septembre 2009, il se penche aujourd’hui sur l’indexation de vidéos. Pour lesquelles le nombre de critères à coder va être encore plus grand ! Mais cela n’impressionne pas le chercheur.

Nathalie Blanc

(1) Irisa : Institut de recherche en informatique et systèmes aléatoires, ou Inria Rennes Bretagne Atlantique. (2) Alain Glavieux et Claude Berrou. Lire Sciences Ouest n°230 - mars 2006 sur www.espace-sciences.org/magazine

Hervé Jégou
herve.jegou [at] inria.fr (herve[dot]jegou[at]inria[dot]fr)

TOUT LE DOSSIER

Abonnez-vous à la newsletter
du magazine Sciences Ouest

Suivez Sciences Ouest