Projet : TEMICS - Scalabilité et communication vidéo

Projet : TEMICS

Précédent : Modélisation, segmentation, représentation d'objets vidéo Remonter : Fondements scientifiques Suivant : Optimisation globale d'un système de

Scalabilité et communication vidéo

Mots clés : hiérarchie de mouvement, segmentation hiérarchique, ``video layering", analyse multigrille, quantification arborescente, optimisation débit-distorsion .

Résumé :

La notion de scalabilité - anglicisme que l'on peut traduire par représentation multiéchelle - pour la représentation de(s) source(s) vidéo est incontournable pour permettre de spécifier des modes de communication adaptatifs aux caractéristiques fortement variables des sources manipulées, des ressources du réseau de communication et des services (terminaux hétérogènes) visés. Cette notion se décline selon les diverses modalités de modélisation et de représentation des différents maillons de la chaine de communication (source, canal, réception). Elle s'appuie donc sur des fondements scientifiques issus de l'analyse multigrille et de la quantification arborescente.

La notion de scalabilité peut se présenter selon plusieurs aspects complémentaires et hybridables:

la scalabilité des objets : les techniques de segmentation spatiotemporelle hiérarchique évoquées au paragraphe précédent conduisent naturellement à une représentation multiéchelle des objets segmentés ;
Base scientifique : cartes de segmentation topologiquement emboîtées.
la scalabilité spatiale : la découpe ordonnée en objets situés à des profondeurs distinctes (segmentation ``multilayers'') est également un mode aisé de structuration des primitives visuelles extraites de la projection image d'une scène tridimensionnelle ;
Base scientifique : géométrie projective et obtention de cartes de profondeur relative sur séquences non calibrées. [Bou94]
la scalabilité temporelle [TA94] : par extension de la notion de GOP (Group Of Pictures) classique dans le cadre MPEG qui structure le flux vidéo en trames IBP, des modes étendus de découpe temporelle sont à définir ;
Base scientifique: interpolation temporelle basée trajectoires d'objets.
la scalabilité de représentation : ceci concerne la représentation d'une source numérique unique des données issues des images en un ensemble ordonné de sources numériques emboîtées permettant la restitution partielle ou progressive des images. D'un point de vue du flux binaire, ceci se traduit par un ensemble de flux élémentaires à concaténer ;
Base scientifique : décomposition EZT [Sha93] ou SPIHT [SP96], paquets d'ondelettes, quantification vectorielle arborescente, représentations multiples hybrides et hiérarchiques.
la scalabilité au niveau réseau : les réseaux de communication actuels ne raisonnent plus uniquement sur un niveau unique de ressources (débit/distorsion) mais sur une hiérarchie de niveaux de communication accessibles selon la demande (priorité de service) ou la disponibilité du réseau (lois de débits, engorgement, ...) [BTW94]. Ces phases de modélisation sont à introduire pour contrôler l'interface source-réseau ;
la scalabilité au niveau réception [MJV96]: ce niveau inclut les contraintes venant de la machine cible (puissance de traitement disponible, qualité du restituteur), des conditions de service visé (gamme de qualité, droit d'accès, temps alloué, ...) et de l'usage final de la communication réalisée (nature des post-traitements). Ces contraintes peuvent être extrêmement hétérogènes (diffusion multicast). Les qualités de service attendues doivent être modélisées et introduites, comme contraintes externes et objectifs scalables en terme de distorsion.

Enfin, comme ci-dessus pour une hiérarchie de débits, il est possible aussi d'introduire une hiérarchie de distorsions admissibles prenant en compte éventuellement l'aspect de sélectivité des objets; en effet, contrairement aux cadres standards de compression (JPEG, MPEG) qui s'adressent à des services multimédia de communication non dédiés et qui fournissent donc une qualité de reconstruction homogène sans sélectivité (si ce n'est la sélectivité en fréquences par quantification adaptée des différents coefficients fréquentiels issus d'une décomposition DCT), il apparaît de plus en plus souhaitable, pour d'autres services de communication (télémédecine, imagerie satellitaire, vidéosurveillance, robotique mobile) de modéliser et d'introduire les connaissances a-priori dans l'algorithmique de représentation/compression. Cette sélectivité est définie à partir de modèles perceptuels ou est guidée par l'application et le contenu de scènes. La sélectivité s'exprime alors par une hiérarchisation de l'information tant spatiotemporelle (basée mouvement ou objets) que fréquentielle (basée lois de sensibilité en fréquences).
Base scientifique : décomposition ondelettes, segmentation et projection, quantification optimale (scalaire ou vectorielle), échantillonnage irrégulier [RR95], maillages hiérarchiques [TEST96].

Précédent : Modélisation, segmentation, représentation d'objets vidéo Remonter : Fondements scientifiques Suivant : Optimisation globale d'un système de