Compression sémantique d’écrans d’avion

Reconnaissance et codage d’éléments graphiques dans des vidéos d’écran d’avion

Les écrans d’avion contiennent des informations graphiques comme l’altitude, la vitesse, ou encore des lignes ou des cercles. Si d’un côté ces informations sont très importantes pour le pilote, de l’autre elles sont “difficiles” à coder car elle n’ont pas les mêmes caractéristiques que les images “naturelles”, ce qui conduit à des forts artefacts de codage qui peuvent nuire à la lisibilité de ces informations.

Exemple d’écran d’avion. Le codage « standard » produit des artefacts sur le texte.

Dans cette activité de recherche on souhaite donc extraire d’une vidéo d’écran d’avion les informations graphiques telles que le texte, les lignes droites et les cercles, et les coder séparément de la partie visuelle. Dans l’exemple de la figure ci-dessus, on propose de coder le texte (13JAN2012 etc) et l’image de la mer séparément.

A ce fin plusieurs problèmes doivent être résolus :

  1. Détection du texte et reconnaissance de chaque caractère : un réseau convolutionnel est utilisé pour ces tâches
  2. Codage du texte en tant que tel et codage de l’image residuelle
  3. Prise en compte de l’évolution temporelle

Ce projet est au coeur de la thèse de notre doctorante Iulia Mitrica <iulia.mitrica@telecom-paristech.fr>

 

 

Mon blog professionnel d'enseignant/chercheur de Telecom-ParisTech