1
Tema 3
Compresión de la informaciónen televisión digital(formato MPEG-2)
Contenidos
• Introducción• La compresión de la señal de vídeo• La redundancia en la información de vídeo• Métodos de compresión por transformación: la
DCT.• Algunos estándares de compresión• Estándar de compresión MPEG-2• Aplicaciones de la compresión de vídeo• Bibliografía
2
Introducción (1)
13.56.75
3.375
13.513.513.5
4:4:44:2:24:1:1
Frecuencia muestreo
(CR,CB) (MHz)
Frecuencia muestreo (Y)
(MHz)Estándar
• Problema: cantidad de información necesaria
Introducción (1)
248.8165.9124.4
Datos 1 seg. parte activa
(Mb/s)5m 22s8m 02s10m 43s
324216162
4:4:44:2:24:1:1
Capacidad de disco 10 GB
(mm:ss)
Datos 1 seg. almacenados
(Mb/s)Estándar
• Problema: cantidad de información necesaria
3
Introducción (2)
• En transmisión, una canal 4:2:2 ocupa lo que 2590 canales telefónicos.
• Espacio en disco y ancho de banda son recursos limitados.
• Solución: Reducir el flujo binario
Introducción (3)
• Reducción del flujo binario
8m 02s16m 04s26m 30s40m 10s
1h 20m 20s6h 41m 40s
165.983.050.333.216.63.3
1:12:1
3.3:15:110:150:1
Capacidad en disco 10GB
Tamaño parte activa (Mb/s)
Compresión Formato 4:2:2
4
Introducción (4)
• Compresión como factor económico
• Compresión por necesidad (Videoconferencia)
• La compresión requiere descompresión
La compresión de laseñal de video (1)
• Información real – información redundante• La compresión puede afectar a la calidad
– Compresión sin pérdidas– Compresión subjetivamente sin pérdidas– Compresión subjetivamente con pérdidas
• Existen multitud de métodos– Familias 4:2:2, 4:1:1, 4:2:0.– Métodos por transformación MPEG-2.
5
La compresión de laseñal de video
• Compresión por transformación– Concentración de la información– Cuantificación y codificación
• Características de MPEG-2– Múltiples factores de compresión (adaptable)– Baja pérdida de calidad– Compresión y calidad adaptables al coste.
La compresión de laseñal de video
• Método más utilizado en vídeo.– Enlaces dentro del estudio de TV (3,3:1)– Comunicaciones punto a punto (3,3:1)
• Cable, fibra, enlaces, y satélite– Difusión de televisión
• Dependiente de la calidad requerida• 4 a 7 canales digitales en ancho de banda analógico
6
La redundancia en la información de video
• Existencia de información redundante– Eliminando redundancia comprimimos– La redundancia es positiva en cuanto a
seguridad• Tipos de redundancia en vídeo
– Espacial– Temporal– Estadística
La redundancia en la información de video
• Redundancia espacial– Interior a cada fotograma– Continuidad en los
objetos– Codificación de un valor
representativo y diferencias
– Codificación de longitudes de recorrido (RLC)
7
La redundancia en la información de video
• Redundancia temporal– Continuidad en la acción– Similaridad entre
fotogramas consecutivos– Codificación DPCM
La redundancia en la información de video
• Redundancia temporal– Codificación DPCM
8
La redundancia en la información de video
• Redundancia estadística– Algunos valores se repiten más que otros– Codificación de longitud variable (VLC)– Ejemplo: código Huffman
Métodos de compresión por transformación: la DCT
• Búsqueda de redundancias en el dominio transformado.– En el dominio espacio-tiempo la probabilidad
de aparición de los píxeles es constante.– En el dominio de la frecuencia no.– El ojo atiende más a los objetos grandes que a
los pequeños o los contornos.• La DCT se utiliza en muchos métodos de
compresión: JPEG, MPEG, ...
9
Métodos de compresión por transformación: la DCT
• Transformada Discreta del Coseno unidimensional.– Convierte una secuencia de N muestras en otra
secuencia de tamaño N que representa una distribución de frecuencias.
Métodos de compresión por transformación: la DCT
• Cálculo de la DCT unidimensional.
• 0 < u < N-1
• Los C[u] se denominan coeficientes.
DCT(x[n]) ' C[u] ' α(u) ·jN&1
n'0x[n] · cos (2n%1) π u
2N
α(u) | u'0 '1N
α(u) | uÖ0 '2N
10
Métodos de compresión por transformación: la DCT
• Cálculo de la DCT inversa unidimensional.
α(u) | u'0 '1N
α(u) | uÖ0 '2N
DCT&1(C[u]) ' x[n] ' jN&1
u'0α(u) ·C[u] · cos (2n%1) π u
2N
Métodos de compresión por transformación: la DCT
• Cálculo de la DCT: Método de las “funciones base”.– Dado
– Definimos funciones base como
DCT(x[n]) ' C[u] ' α(u) ·jN&1
n'0x[n] · cos (2n%1) π u
2N
f[n] | u ' cos (2n%1) π u2N
11
Métodos de compresión por transformación: la DCT
• Cálculo de la DCT: Método de las “funciones base”.– A partir de las funciones base
– Producto escalar de dos vectores
DCT(x[n]) ' C[u] ' α(u) ·jN&1
n'0x[n] · f[n]|u
Métodos de compresión por transformación: la DCT
• Representación de las “funciones base”
12
Métodos de compresión por transformación: la DCT
• Representación de las “funciones base”
Métodos de compresión por transformación: la DCT
• Transformada Discreta del Coseno bidimensional.– Convierte una matriz de NxM muestras en otra
matriz de tamaño NxM que representa una distribución de frecuencias en las direcciones x e y.
13
Métodos de compresión por transformación: la DCT
• Cálculo de coeficientes DCT bidimensional.
• 0 < u < M-1 y 0 < v < N-1
C[u,v] ' α(u) · β(v) · jM&1
m'0j
N&1
n'0x[m,n] · cos (2m%1) π u
2M· cos (2n%1) π v
2N
α(u) | u'0 '1
Mα(u) | uÖ0 '
2
M
β(u) | u'0 '1
Nβ(u) | uÖ0 '
2
N
Métodos de compresión por transformación: la DCT
• Cálculo de la DCT inversa bidimensional.
• Función base
x[m,n] ' jM&1
m'0α(u) · j
N&1
n'0β(v) · C[u,v] · cos (2m%1) π u
2M· cos (2n%1) π v
2N
f(m,n) |u,v' cos (2m%1) π u2M
cos (2n%1) π v2N
14
Métodos de compresión por transformación: la DCT
• Representación de las “funciones base”
Propiedades de la DCT
La DCT por sí sola no implica compresión• Propiedad de separabilidad• Gran compactación de la energía en
coeficientes de baja frecuencia• Escasa correlación entre coeficientes• La DCT es una transformación real• Supresión de los coeficientes de mayor orden
15
Utilización de la DCT para compresión
División de la imagen en matrices 8x8.• Lectura en zig-zag• Cuantificación de los coeficientes• Codificaciones RLC y VLC• Control de flujo de salida
Utilización de la DCT para compresión
• Lectura en zig-zag (dominio espacial)
x[m,n]'
&76 &73 &67 &62 &58 &67 &64 &55&65 &69 &62 &38 &19 &43 &59 &56&66 &69 &60 &15 16 &24 &62 &55&65 &70 &57 6 26 &22 &28 &59&61 &67 &60 &24 &28 &40 &60 &58&49 &63 &68 &58 &51 &65 &70 &53&43 &57 &64 &69 &73 &67 &63 &45&41 &49 &59 &60 &63 &52 &50 &34
16
Utilización de la DCT para compresión
• Lectura en zig-zag (dominio DCT)
C[u,v]'
&414 &29 &62 25 55 &20 &1 26 &21 &62 8 12 &7 &6 7&46 8 77 &26 &30 10 6 &5&49 12 34 &14 &10 6 1 111 &8 &12 &2 &1 1 &5 2&10 1 3 &3 0 0 2 0&3 &1 1 0 1 &4 2 &3&1 &1 0 &3 0 0 &1 0
Utilización de la DCT para compresión
• Lectura en zig-zag– Los coeficientes más significativos están en la
parte de baja frecuencia– Interesa leer de manera que los coeficientes de
menor peso queden agrupados– Códigos RLC puedn identificar largas cadenas
de coeficientes nulos
17
Utilización de la DCT para compresión
• Lectura en zig-zag– La lectura comienza por el coeficiente DC
Utilización de la DCT para compresión
• Cuantificación de los coeficientes– Se aplica al resultado de la DCT– Afecta a la calidad final– Se procesa de forma diferente cada coeficiente
• Mayor importancia en la calidad final de los coeficientes de baja frecuencia
• Para baja frecuencia se utilizan escalones menores– Algunos coeficientes se irán a cero y otros se
codificarán con menos bits.
18
Utilización de la DCT para compresión
• Codificación de longitudes de recorrido– A partir de la cuantificación y de la lectura en
zig-zag aparecen cadenas largas de ceros que e pueden codificar en conjunto con menos bits
• Codificación de longitudes variables– Aquellos coeficientes no nulos que aparecen
con más frecuencia se codifican con menos bits
Utilización de la DCT para compresión
• Control de flujo binario a la salida– Los métodos anteriores conviven para aumentar
la compresión al máximo– Diferentes bloques 8x8 dan como resultado
factores de compresión diferentes– En secuencias de vídeo, es imprevisible la
velocidad a la que se puede transmitir
19
Utilización de la DCT para compresión
• Control de flujo binario a la salida– Se dispone un buffer a la salida– Dependiendo de lo lleno del buffer, el bloque
de control de flujo aumenta o disminuye la compresión actuando sobre la cuantificación
• Mayor detalle => ojo menos sensible• Mayor detalle => mayor compresión
Utilización de la DCT para compresión
• Diagrama de bloques
A/D DCT
Bucle de control flujo binario
Cuantif.VLCRLC
BufferRAM
Tablacuantif.
TablaHuffman
Y
R-Y
B-Y
Ponderacióncoefic. DCT
Código delongitudvariable
20
Estándares de compresión
• Norma JPEG: generalidades– Compresión de imágenes fotográficas– Minimiza redundancia espacial– Permite factor de compresión variable– Compresión subjetivamente sin pérdidas hasta
factor 3,3:1– Utilizable hasta factor 100:1– Rango de flujos binarios entre 3,3 a 80 Mb/s
Estándares de compresión
• Norma JPEG: modo de compresión– DCT a bloques 8x8– Cuantificación ponderada– Lectura en zig-zag– Codificación Huffman y RLC
• Estructuras de compresión– Secuencial (por bloques)– Progresiva (por coeficientes)
21
Estándares de compresión
• Estándar MJPEG– Necesidad de compresión en procesos de
edición no lineal– La compresión intercuadro dificulta el acceso
aleatorio– Es un sistema que aplica JPEG a cada
fotograma– Multiples versiones incompatibles entre sí
• AVID (3:1) – EVS(6:1)
Estándar MPEG-2
• Contenidos– Introducción a MPEG– Compresión intracuadro e intercuadro– Imágenes I, P y B– Codificador y decodificador– Tren de datos MPEG-2– Niveles y perfiles– Organización del flujo de transporte
22
Estándar MPEG-2
• Introducción– Reducción del flujo binario sin pérdida de
calidad subjetiva– Adaptable en formato de imagen– Adaptable a distintos niveles de calidad– Adaptable en cuanto a factores de compresión– Adaptable en coste de la aplicación– Compatibilidad
Estándar MPEG-2
• Introducción– Utilizado especialmente en televisión digital– MPEG-1 reducción de la velocidad binaria a
1,5 Mb/s (flujo de un CD-ROM)• 1,5 a 3 Mb/s
– MPEG-2 orientado a la televisión profesional• Transmisión, almacenamiento, difusión, etc• 3,5 a 100 Mb/s
23
Estándar MPEG-2• Introducción
– MPEG-4 Adaptación del vídeo al flujo binario de las redes telefónicas
• Introduce la codificación de objetos• Flujos de 64kb/s a 4Mb/s• También relacionado con aplicaciones multimedia
– MPEG-7 Contenidos audiovisuales• Aplicación en archivo y montajes
– MPEG-21 Gestión del material audiovisual• Transacciones comerciales y derechos de autor
Estándar MPEG-2• Compresión intracuadro
– Similar a la vista en JPEG– DCT(8x8), cuantificación, zig-zag, VLC-RLC
• Compresión intercuadro– Minimiza redundancia temporal– Codificación diferencial DPCM– Compensación de movimiento– Consigue niveles de compresión más altos
24
Estándar MPEG-2
• Compresión intercuadro– Codificación diferencial DPCM
• No se codifica la imagen actual sino su diferencia respecto de la anterior
• Zonas de la imagen que no cambian no se codifican
• Válido para secuencias sin movimiento
Estándar MPEG-2• Compresión intercuadro
– Técnica de compensación de movimiento• Trabaja sobre “macrobloques” 16x16• Cálculo y codificación de vectores de desplazamiento
– Comparación con píxel homólogo– Zona de búsqueda– Codificación de la diferencia con el más parecido
• Si el parecido esta por debajo de un umbral, codificación espacial
25
Estándar MPEG-2• Imágenes I, P, y B
– Máxima compresión de los algoritmos MPEG– Imágenes I (intracuadro)
• Compresión independiente de un fotograma (JPEG)• Aportan poca compresión• Permiten acceso aleatorio directo
– Imágenes P (Predicción)• Comparación con imagen I o P anterior• Codificación de vectores de movimiento• Codificación diferencial (error de predicción)
Estándar MPEG-2• Imágenes I, P, y B
– Imágenes B (bidireccionales)• Comparación con imagen I o P anterior y posterior• No propagan errores pero pueden recibirlos
26
Estándar MPEG-2• Imágenes I, P, y B
– Grupo de fotogramas (GOP)• Elección de nº de imágenes I, P y B para cada
aplicación• GOP – Nº de cuadros entre dos imágenes tipo I• Tamaño habitual 12 imágenes
I B B P B B P B B P B B I ...• Los cambios de plano inician un nuevo GOP• En transmisión se altera el orden
I P B B P B B P B B I B B ...
Estándar MPEG-2• Codificador MPEG-2
27
Estándar MPEG-2• Decodificador MPEG-2
– Proceso codificación decodificación no simétrico
Estándar MPEG-2• Estructura del tren de datos (elementos)
– Cada elemento lleva su cabecera• Bloque (8x8) Unidad proceso DCT• Macrobloque (2x2 bloques) Compensación de mov.• Slice (grupo variable de macrobloques)
– Todos en una misma fila– Macrobloques no contenidos en ningún slice no se codifican
• Imagen (cuadro o campo)• GOP Acotado por imágenes I
– Mínimo elemento descomprimible por sí solo
• Secuencia Conjunto de GOPs
28
Estándar MPEG-2
• Niveles y perfiles– Proporcionan flexibilidad a la compresión– Niveles: definen la resolución de las imágenes
• Nivel Bajo Resolución SIF (352x288)• Nivel principal Resolución 4:2:0 (720x576)• Nivel alto 1440 TVAD (1440x1152). Formato 4/3• Nivel alto TVAD (1920x1152). Formato 16/9
Estándar MPEG-2• Niveles:
– Los regímenes binarios son diferentes– Sólo se codifican muestras activas– Debe conocerse el sistema de codificación
original para recuperar periodos de borrado– Codificador específico para cada nivel pero
compatible con los inferiores.
29
Estándar MPEG-2• Perfiles:
– Compromiso entre compresión y coste• Perfil bajo.
– Imágenes I y P.– Muestreo 4:2:0
• Perfil Principal.– Incluye imágenes B.– Mejor compromiso calidad precio
• Perfil 4:2:2. Producción– Muestreo 4:2:2 o 4:2:0– GOPs pequeños para acceso aleatorio– Admite generaciones múltiples
Estándar MPEG-2• Perfiles escalables
– Estructura en capas• Capa base:
– Baja definición.– Muy protegida contra ruido– Puede decodificarla cualquier tipo de decodificador
• Capas de realce:– Información suplementaria de mejora– Menos protegida– Necesidad de decodificadores complejos
• Diferentes formatos y diferente definición simultánea
30
Estándar MPEG-2• Perfiles escalables
– Perfil escalable SNR (Relación señal-ruido)• La capa base contiene menos bits pos muestra• Capa de realce aumenta la definición
– Perfil escalable espacial• La capa base contiene nivel más bajo• La capa de mejora, resto para nivel principal, alto,...
– Perfil alto• Escalable en definición y espacialmente• Previsto para TVAD: Muestreo 4:2:2 e imágenes IPB
Estándar MPEG-2
• Perfiles escalables– Aplicación de la escalabilidad
• Difusión en varios formatos y definiciones.• Receptores portátiles
– Nivel de señal bajo. Decodificador sencillo. Capa base
• Receptores estacionarios con señales más estables– Nivel de señal más estable.– Decodificador más complejo. Capas de realce.
– Compatibilidad ascendente entre perfiles
31
Estándar MPEG-2• Niveles y perfiles
4 Mb/s4 Mb/sBAJO
352 Píxeles288 Líneas
20 Mb/s15 Mb/s50 Mb/s
720x60815 Mb/s15 Mb/s
PRINCIPAL720 Píxeles576 Líneas
80 Mb/s60 Mb/s60 Mb/sALTO -1440
1440 Píxeles1152 Líneas
100 Mb/s80 Mb/sALTO
1920 Píxeles1152 Líneas
ALTO
I,P,B4:2:0 y 4:2:2
ESCALABLE ESPACIAL
I,P,B - 4:2:0
ESCALABLE SNR
I,P,B - 4:2:0
4:2:2Producción
I,P,B
PRINCIPAL
I,P,B - 4:2:0
SIMPLE
I,P - 4:2:0
Perfiles
Niveles
Estándar MPEG-2• Organización del flujo de transporte
– Corriente elemental (flujo de video, audio, o datos)• Paquetes de corriente elemental (PES)• Longitud de paquete grande• Información sobre contenido, sincronización
– Multiplexión de corrientes elementales• Corriente de programa (PS)• Corriente de transporte (TS)
32
Estándar MPEG-2• Organización del flujo de transporte
Estándar MPEG-2
• Corriente de programa (PS)– Multiplexión simple intercalando PES– Útil en canales sin ruido (ej: DVD)– No necesita corrección de errores– Hasta 16 corrientes de vídeo y 32 de audio
• Todas deben tener la misma base de tiempos
33
Estándar MPEG-2
• Corriente de transporte (TS)– Entornos ruidosos (ej: difusión TV)– Paquetes cortos 188 Bytes– Técnicas de corrección de errores– Alberga varios programas de televisión
• Pueden tener diferente temporización• Puede llevar información de acceso condicional
– Flujo binario constante
Estándar MPEG-2
• Corriente de transporte (TS)
34
Aplicaciones de la compresión
• Producción en estudios de televisión• Periodismo electrónico• Transmisión y difusión de la señal de vídeo• Servidores de vídeo• Multimedia• Sistemas domésticos• Videoconferencia
Aplicaciones de la compresión
• Producción en estudios de televisión– Reducción del coste de almacenaje– Alta multigeneración
• Necesidad de mantener muy alta calidad• Factores de compresión bajos
– MPEG-2 Perfil 4:2:2 para estudio• Regímenes binarios de 50 Mb/s (factor 3,3:1)• GOP pequeño: IBIBIB, IPBIPB
35
Aplicaciones de la compresión
• Periodismo electrónico– Necesidad de portabilidad de equipos– Necesidad de reducir el consumo
• Utilización de formatos 4:1:1 y 4:2:0– Disminución de la multigeneración
• Compresión algo más alta. MPEG-2 (5:1, o 10/1)• Flujos binarios de 15 a 30 Mb/s
Aplicaciones de la compresión
• Transmisión y difusión– Para transmisión con alta multigeneración
• Factores de compresión bajos (3,3:1)– Para difusión
• Escasa multigeneración• MPEG-2 Factores de compresión altos • Flujo binario calidad de estudio (9 Mb/s)• Flujo binario calidad PAL (5 Mb/s)
36
Aplicaciones de la compresión
• Servidores de vídeo– Necesidad de gran almacenaje– Necesidad de rápido acceso
• Mucha competencia entre formatos• MPEG-2 dificultad de acceso con alta compresión
Aplicaciones de la compresión
• Multimedia– Escasa capacidad de los ordenadores– Sistemas hardware de compresión escasos
• Algoritmos software, NO en tiempo real– Multigeneración escasa– Economía de utilización– Multitud de algoritmos de compresión
• Archivos AVI con MJPEG, MPEG-2, MPEG-4...
37
Aplicaciones de la compresión
• Sistemas domésticos– MPEG-2 en DVD, y televisión digital
• Coste del decodificador bajo– Problema: coste del codificador
• Grabadores de DVD caros para tiempo real– Magnetoscopios
• Disminución del régimen binario reduce el coste• Necesidad de codificadores sencillos y económicos• Formato DV con baja compresión.
Aplicaciones de la compresión
• Videoconferencia– Comunicación en dos direcciones
• MPEG-2 sin cuadros B– con cuadros B => excesivo retardo
• MPEG-4– Regímenes binarios muy bajos con calidad alta– Limitación en el movimiento de los objetos
38
Compresión en cascada
• Sucesivas compresiones y descompresiones• Con el mismo algoritmo
– Deterioro progresivo de la calidad• Si se utilizan algoritmos diferentes
– Deterioro imprevisible• Recomendación utilizar en toda la cadena
– Mismo método de compresión– Mismo factor
Bibliografía
• Mitchell, J.L. “MPEG Video Compression Standard” International Thompson Publishing” 1996.
• Ortiz Berenguer, L. “TV Digital: MPEG-2 y DVB”. Servicio Publicaciones UPM. 1999.
• Martín Marcos, A. “Televisión Digital Norma MPEG-2 (video)”. Ciencia 3. 1998.