Título: Weighted distortion methods for error resilient video coding
Autores: Maucho, Geoffrey Sunday
Fecha: 2012
Publicador: McGill University - MCGILL
Fuente:
Tipo: Electronic Thesis or Dissertation
Tema: Engineering - Electronics and Electrical
Descripción: Wireless and Internet video applications are hampered by bit errors and packet errors, respectively. In addition, packet losses in best effort Internet applications limit video communication applications. Because video compression uses temporal prediction, compressed video is especially susceptible to the problem of transmission errors in one frame propagating into subsequent frames. It is therefore necessary to develop methods to improve the performance of compressed video in the face of channel impairments. Recent work in this area has focused on estimating the end-to-end distortion, which is shown to be useful in building an error resilient encoder. However, these techniques require an accurate estimate of the channel conditions, which is not always accessible for some applications.Recent video compression standards have adopted a Rate Distortion Optimization (RDO) framework to determine coding options that address the trade-off between rate and distortion. In this dissertation, error robustness is added to the RDO framework as a design consideration. This dissertation studies the behavior of motion-compensated prediction (MCP) in a hybrid video coder, and presents techniques of improving the performance in an error prone environment. An analysis of the motion trajectory gives us insight on how to improve MCP without explicit knowledge of the channel conditions. Information from the motion trajectory analysis is used in a novel way to bias the distortion used in RDO, resulting in an encoded bitstream that is both error resilient and bitrate efficient.We also present two low complexity solutions that exploit past inter-frame dependencies. In order to avoid error propagation, regions of a frame are classified according to their potential of having propagated errors. By using this method, we are then able to steer the MCP engine towards areas that are considered ``safe" for prediction. Considering the impact error propagation may have in a RDO framework, our work enhances the overall perceived quality of compressed video while maintaining high coding efficiency. Comparison with other error resilient video coding techniques show the advantages offered by the weighted distortion techniques we present in this dissertation.
Les applications vidéo pour l'Internet et les systèmes de communication sans fil sont respectivement entravées par les erreurs de paquets et de bits. De plus, les pertes de paquets des meilleures applications Internet limitent les communications vidéo. Comme la compression vidéo utilise des techniques de prédiction temporelle, les transmissions de vidéos comprimés sont particulièrement sensibles aux erreurs se propageant d'une trame à l'autre. Il est donc nécessaire de développer des techniques pour améliorer la performance de la compression vidéo face au bruit des canaux de transmission. De récents travaux sur le sujet ont mis l'emphase sur l'estimation de la distorsion point-à-point, technique utile pour construire un codeur vidéo tolérant aux erreurs. Ceci étant dit, cette approche requiert une estimation précise des conditions du canal de transmission, ce qui n'est pas toujours possible pour certaines applications.Les standards de compression récents utilisent un cadre d'optimisation dèbit distorsion (RDO) afin de déterminer les options de codage en fonction du compromis souhaité entre distorsion et taux de transmission. Dans cette thèse, nous ajoutons la robustesse aux erreurs au cadre RDO en tant que critère de conception. Nous étudions le comportement de la prédiction de mouvement compensé (MCP) dans un codeur vidéo hybride et présentons des techniques pour en améliorer la performance dans des environnements propices aux erreurs. L'analyse de la trajectoire du mouvement nous permet d'améliorer la MCP sans connatre explicitement les conditions du canal de transmission. L'information de l'analyse de la trajectoire du mouvement est utilisée de façon à contrer le biais de la distorsion utilisée dans le cadre RDO, ce qui permet d'obtenir un encodage binaire d'un taux eficace et résistant aux erreurs. Nous présentons également deux techniques à faible complexité qui exploitent la dépendance entre la trame à coder et les trames qui précèdent. Afin d'éviter la propagation des erreurs, les régions d'une trame sont classées en fonction de leur potentiel à contenir des erreurs propagées. Avec cette méthode, nous sommes ` même de diriger l'outil MCP vers les régions où la prédiction peut être faite de façon "sécuritaire". Considérant l'impact que peut avoir la propagation des erreurs dans un cadre RDO, nos travaux améliorent la qualité globale perçue de vidéos comprimés tout en maintenant de bons taux de transmission. Des comparaisons avec les meilleures techniques robustes de codage vidéo présentement utilisées démontrent les avantages offerts par les techniques de distorsion pondérée présentées dans cette thèse.
Idioma: en