Download - Tema 3 - UCLMetsiiab.uclm.es/~jmlova/Archivos/NT/Archivos/... · 2008-10-03 · –Minimiza redundancia espacial –Permite factor de compresión variable –Compresión subjetivamente

1

Tema 3

Compresión de la informaciónen televisión digital(formato MPEG-2)

Contenidos

• Introducción• La compresión de la señal de vídeo• La redundancia en la información de vídeo• Métodos de compresión por transformación: la

DCT.• Algunos estándares de compresión• Estándar de compresión MPEG-2• Aplicaciones de la compresión de vídeo• Bibliografía

2

Introducción (1)

13.56.75

3.375

13.513.513.5

4:4:44:2:24:1:1

Frecuencia muestreo

(CR,CB) (MHz)

Frecuencia muestreo (Y)

(MHz)Estándar

• Problema: cantidad de información necesaria

Introducción (1)

248.8165.9124.4

Datos 1 seg. parte activa

(Mb/s)5m 22s8m 02s10m 43s

324216162

4:4:44:2:24:1:1

Capacidad de disco 10 GB

(mm:ss)

Datos 1 seg. almacenados

(Mb/s)Estándar

• Problema: cantidad de información necesaria

3

Introducción (2)

• En transmisión, una canal 4:2:2 ocupa lo que 2590 canales telefónicos.

• Espacio en disco y ancho de banda son recursos limitados.

• Solución: Reducir el flujo binario

Introducción (3)

• Reducción del flujo binario

8m 02s16m 04s26m 30s40m 10s

1h 20m 20s6h 41m 40s

165.983.050.333.216.63.3

1:12:1

3.3:15:110:150:1

Capacidad en disco 10GB

Tamaño parte activa (Mb/s)

Compresión Formato 4:2:2

4

Introducción (4)

• Compresión como factor económico

• Compresión por necesidad (Videoconferencia)

• La compresión requiere descompresión

La compresión de laseñal de video (1)

• Información real – información redundante• La compresión puede afectar a la calidad

– Compresión sin pérdidas– Compresión subjetivamente sin pérdidas– Compresión subjetivamente con pérdidas

• Existen multitud de métodos– Familias 4:2:2, 4:1:1, 4:2:0.– Métodos por transformación MPEG-2.

5

La compresión de laseñal de video

• Compresión por transformación– Concentración de la información– Cuantificación y codificación

• Características de MPEG-2– Múltiples factores de compresión (adaptable)– Baja pérdida de calidad– Compresión y calidad adaptables al coste.

La compresión de laseñal de video

• Método más utilizado en vídeo.– Enlaces dentro del estudio de TV (3,3:1)– Comunicaciones punto a punto (3,3:1)

• Cable, fibra, enlaces, y satélite– Difusión de televisión

• Dependiente de la calidad requerida• 4 a 7 canales digitales en ancho de banda analógico

6

La redundancia en la información de video

• Existencia de información redundante– Eliminando redundancia comprimimos– La redundancia es positiva en cuanto a

seguridad• Tipos de redundancia en vídeo

– Espacial– Temporal– Estadística


• Redundancia espacial– Interior a cada fotograma– Continuidad en los

objetos– Codificación de un valor

representativo y diferencias

– Codificación de longitudes de recorrido (RLC)

7


• Redundancia temporal– Continuidad en la acción– Similaridad entre

fotogramas consecutivos– Codificación DPCM


• Redundancia temporal– Codificación DPCM

8


• Redundancia estadística– Algunos valores se repiten más que otros– Codificación de longitud variable (VLC)– Ejemplo: código Huffman

Métodos de compresión por transformación: la DCT

• Búsqueda de redundancias en el dominio transformado.– En el dominio espacio-tiempo la probabilidad

de aparición de los píxeles es constante.– En el dominio de la frecuencia no.– El ojo atiende más a los objetos grandes que a

los pequeños o los contornos.• La DCT se utiliza en muchos métodos de

compresión: JPEG, MPEG, ...

9


• Transformada Discreta del Coseno unidimensional.– Convierte una secuencia de N muestras en otra

secuencia de tamaño N que representa una distribución de frecuencias.


• Cálculo de la DCT unidimensional.

• 0 < u < N-1

• Los C[u] se denominan coeficientes.

DCT(x[n]) ' C[u] ' α(u) ·jN&1

n'0x[n] · cos (2n%1) π u

2N

α(u) | u'0 '1N

α(u) | uÖ0 '2N

10


• Cálculo de la DCT inversa unidimensional.

α(u) | u'0 '1N

α(u) | uÖ0 '2N

DCT&1(C[u]) ' x[n] ' jN&1

u'0α(u) ·C[u] · cos (2n%1) π u

2N


• Cálculo de la DCT: Método de las “funciones base”.– Dado

– Definimos funciones base como

DCT(x[n]) ' C[u] ' α(u) ·jN&1

n'0x[n] · cos (2n%1) π u

2N

f[n] | u ' cos (2n%1) π u2N

11


• Cálculo de la DCT: Método de las “funciones base”.– A partir de las funciones base

– Producto escalar de dos vectores

DCT(x[n]) ' C[u] ' α(u) ·jN&1

n'0x[n] · f[n]|u


• Representación de las “funciones base”

12




• Transformada Discreta del Coseno bidimensional.– Convierte una matriz de NxM muestras en otra

matriz de tamaño NxM que representa una distribución de frecuencias en las direcciones x e y.

13


• Cálculo de coeficientes DCT bidimensional.

• 0 < u < M-1 y 0 < v < N-1

C[u,v] ' α(u) · β(v) · jM&1

m'0j

N&1

n'0x[m,n] · cos (2m%1) π u

2M· cos (2n%1) π v

2N

α(u) | u'0 '1

Mα(u) | uÖ0 '

2

M

β(u) | u'0 '1

Nβ(u) | uÖ0 '

2

N


• Cálculo de la DCT inversa bidimensional.

• Función base

x[m,n] ' jM&1

m'0α(u) · j

N&1

n'0β(v) · C[u,v] · cos (2m%1) π u

2M· cos (2n%1) π v

2N

f(m,n) |u,v' cos (2m%1) π u2M

cos (2n%1) π v2N

14



Propiedades de la DCT

La DCT por sí sola no implica compresión• Propiedad de separabilidad• Gran compactación de la energía en

coeficientes de baja frecuencia• Escasa correlación entre coeficientes• La DCT es una transformación real• Supresión de los coeficientes de mayor orden

15

Utilización de la DCT para compresión

División de la imagen en matrices 8x8.• Lectura en zig-zag• Cuantificación de los coeficientes• Codificaciones RLC y VLC• Control de flujo de salida


• Lectura en zig-zag (dominio espacial)

x[m,n]'

&76 &73 &67 &62 &58 &67 &64 &55&65 &69 &62 &38 &19 &43 &59 &56&66 &69 &60 &15 16 &24 &62 &55&65 &70 &57 6 26 &22 &28 &59&61 &67 &60 &24 &28 &40 &60 &58&49 &63 &68 &58 &51 &65 &70 &53&43 &57 &64 &69 &73 &67 &63 &45&41 &49 &59 &60 &63 &52 &50 &34

16


• Lectura en zig-zag (dominio DCT)

C[u,v]'

&414 &29 &62 25 55 &20 &1 26 &21 &62 8 12 &7 &6 7&46 8 77 &26 &30 10 6 &5&49 12 34 &14 &10 6 1 111 &8 &12 &2 &1 1 &5 2&10 1 3 &3 0 0 2 0&3 &1 1 0 1 &4 2 &3&1 &1 0 &3 0 0 &1 0


• Lectura en zig-zag– Los coeficientes más significativos están en la

parte de baja frecuencia– Interesa leer de manera que los coeficientes de

menor peso queden agrupados– Códigos RLC puedn identificar largas cadenas

de coeficientes nulos

17


• Lectura en zig-zag– La lectura comienza por el coeficiente DC


• Cuantificación de los coeficientes– Se aplica al resultado de la DCT– Afecta a la calidad final– Se procesa de forma diferente cada coeficiente

• Mayor importancia en la calidad final de los coeficientes de baja frecuencia

• Para baja frecuencia se utilizan escalones menores– Algunos coeficientes se irán a cero y otros se

codificarán con menos bits.

18


• Codificación de longitudes de recorrido– A partir de la cuantificación y de la lectura en

zig-zag aparecen cadenas largas de ceros que e pueden codificar en conjunto con menos bits

• Codificación de longitudes variables– Aquellos coeficientes no nulos que aparecen

con más frecuencia se codifican con menos bits


• Control de flujo binario a la salida– Los métodos anteriores conviven para aumentar

la compresión al máximo– Diferentes bloques 8x8 dan como resultado

factores de compresión diferentes– En secuencias de vídeo, es imprevisible la

velocidad a la que se puede transmitir

19


• Control de flujo binario a la salida– Se dispone un buffer a la salida– Dependiendo de lo lleno del buffer, el bloque

de control de flujo aumenta o disminuye la compresión actuando sobre la cuantificación

• Mayor detalle => ojo menos sensible• Mayor detalle => mayor compresión


• Diagrama de bloques

A/D DCT

Bucle de control flujo binario

Cuantif.VLCRLC

BufferRAM

Tablacuantif.

TablaHuffman

Y

R-Y

B-Y

Ponderacióncoefic. DCT

Código delongitudvariable

20

Estándares de compresión

• Norma JPEG: generalidades– Compresión de imágenes fotográficas– Minimiza redundancia espacial– Permite factor de compresión variable– Compresión subjetivamente sin pérdidas hasta

factor 3,3:1– Utilizable hasta factor 100:1– Rango de flujos binarios entre 3,3 a 80 Mb/s


• Norma JPEG: modo de compresión– DCT a bloques 8x8– Cuantificación ponderada– Lectura en zig-zag– Codificación Huffman y RLC

• Estructuras de compresión– Secuencial (por bloques)– Progresiva (por coeficientes)

21


• Estándar MJPEG– Necesidad de compresión en procesos de

edición no lineal– La compresión intercuadro dificulta el acceso

aleatorio– Es un sistema que aplica JPEG a cada

fotograma– Multiples versiones incompatibles entre sí

• AVID (3:1) – EVS(6:1)

Estándar MPEG-2

• Contenidos– Introducción a MPEG– Compresión intracuadro e intercuadro– Imágenes I, P y B– Codificador y decodificador– Tren de datos MPEG-2– Niveles y perfiles– Organización del flujo de transporte

22

Estándar MPEG-2

• Introducción– Reducción del flujo binario sin pérdida de

calidad subjetiva– Adaptable en formato de imagen– Adaptable a distintos niveles de calidad– Adaptable en cuanto a factores de compresión– Adaptable en coste de la aplicación– Compatibilidad

Estándar MPEG-2

• Introducción– Utilizado especialmente en televisión digital– MPEG-1 reducción de la velocidad binaria a

1,5 Mb/s (flujo de un CD-ROM)• 1,5 a 3 Mb/s

– MPEG-2 orientado a la televisión profesional• Transmisión, almacenamiento, difusión, etc• 3,5 a 100 Mb/s

23

Estándar MPEG-2• Introducción

– MPEG-4 Adaptación del vídeo al flujo binario de las redes telefónicas

• Introduce la codificación de objetos• Flujos de 64kb/s a 4Mb/s• También relacionado con aplicaciones multimedia

– MPEG-7 Contenidos audiovisuales• Aplicación en archivo y montajes

– MPEG-21 Gestión del material audiovisual• Transacciones comerciales y derechos de autor

Estándar MPEG-2• Compresión intracuadro

– Similar a la vista en JPEG– DCT(8x8), cuantificación, zig-zag, VLC-RLC

• Compresión intercuadro– Minimiza redundancia temporal– Codificación diferencial DPCM– Compensación de movimiento– Consigue niveles de compresión más altos

24

Estándar MPEG-2

• Compresión intercuadro– Codificación diferencial DPCM

• No se codifica la imagen actual sino su diferencia respecto de la anterior

• Zonas de la imagen que no cambian no se codifican

• Válido para secuencias sin movimiento

Estándar MPEG-2• Compresión intercuadro

– Técnica de compensación de movimiento• Trabaja sobre “macrobloques” 16x16• Cálculo y codificación de vectores de desplazamiento

– Comparación con píxel homólogo– Zona de búsqueda– Codificación de la diferencia con el más parecido

• Si el parecido esta por debajo de un umbral, codificación espacial

25

Estándar MPEG-2• Imágenes I, P, y B

– Máxima compresión de los algoritmos MPEG– Imágenes I (intracuadro)

• Compresión independiente de un fotograma (JPEG)• Aportan poca compresión• Permiten acceso aleatorio directo

– Imágenes P (Predicción)• Comparación con imagen I o P anterior• Codificación de vectores de movimiento• Codificación diferencial (error de predicción)


– Imágenes B (bidireccionales)• Comparación con imagen I o P anterior y posterior• No propagan errores pero pueden recibirlos

26


– Grupo de fotogramas (GOP)• Elección de nº de imágenes I, P y B para cada

aplicación• GOP – Nº de cuadros entre dos imágenes tipo I• Tamaño habitual 12 imágenes

I B B P B B P B B P B B I ...• Los cambios de plano inician un nuevo GOP• En transmisión se altera el orden

I P B B P B B P B B I B B ...

Estándar MPEG-2• Codificador MPEG-2

27

Estándar MPEG-2• Decodificador MPEG-2

– Proceso codificación decodificación no simétrico

Estándar MPEG-2• Estructura del tren de datos (elementos)

– Cada elemento lleva su cabecera• Bloque (8x8) Unidad proceso DCT• Macrobloque (2x2 bloques) Compensación de mov.• Slice (grupo variable de macrobloques)

– Todos en una misma fila– Macrobloques no contenidos en ningún slice no se codifican

• Imagen (cuadro o campo)• GOP Acotado por imágenes I

– Mínimo elemento descomprimible por sí solo

• Secuencia Conjunto de GOPs

28

Estándar MPEG-2

• Niveles y perfiles– Proporcionan flexibilidad a la compresión– Niveles: definen la resolución de las imágenes

• Nivel Bajo Resolución SIF (352x288)• Nivel principal Resolución 4:2:0 (720x576)• Nivel alto 1440 TVAD (1440x1152). Formato 4/3• Nivel alto TVAD (1920x1152). Formato 16/9

Estándar MPEG-2• Niveles:

– Los regímenes binarios son diferentes– Sólo se codifican muestras activas– Debe conocerse el sistema de codificación

original para recuperar periodos de borrado– Codificador específico para cada nivel pero

compatible con los inferiores.

29

Estándar MPEG-2• Perfiles:

– Compromiso entre compresión y coste• Perfil bajo.

– Imágenes I y P.– Muestreo 4:2:0

• Perfil Principal.– Incluye imágenes B.– Mejor compromiso calidad precio

• Perfil 4:2:2. Producción– Muestreo 4:2:2 o 4:2:0– GOPs pequeños para acceso aleatorio– Admite generaciones múltiples

Estándar MPEG-2• Perfiles escalables

– Estructura en capas• Capa base:

– Baja definición.– Muy protegida contra ruido– Puede decodificarla cualquier tipo de decodificador

• Capas de realce:– Información suplementaria de mejora– Menos protegida– Necesidad de decodificadores complejos

• Diferentes formatos y diferente definición simultánea

30

Estándar MPEG-2• Perfiles escalables

– Perfil escalable SNR (Relación señal-ruido)• La capa base contiene menos bits pos muestra• Capa de realce aumenta la definición

– Perfil escalable espacial• La capa base contiene nivel más bajo• La capa de mejora, resto para nivel principal, alto,...

– Perfil alto• Escalable en definición y espacialmente• Previsto para TVAD: Muestreo 4:2:2 e imágenes IPB

Estándar MPEG-2

• Perfiles escalables– Aplicación de la escalabilidad

• Difusión en varios formatos y definiciones.• Receptores portátiles

– Nivel de señal bajo. Decodificador sencillo. Capa base

• Receptores estacionarios con señales más estables– Nivel de señal más estable.– Decodificador más complejo. Capas de realce.

– Compatibilidad ascendente entre perfiles

31

Estándar MPEG-2• Niveles y perfiles

4 Mb/s4 Mb/sBAJO

352 Píxeles288 Líneas

20 Mb/s15 Mb/s50 Mb/s

720x60815 Mb/s15 Mb/s

PRINCIPAL720 Píxeles576 Líneas

80 Mb/s60 Mb/s60 Mb/sALTO -1440


100 Mb/s80 Mb/sALTO


ALTO

I,P,B4:2:0 y 4:2:2

ESCALABLE ESPACIAL

I,P,B - 4:2:0

ESCALABLE SNR

I,P,B - 4:2:0

4:2:2Producción

I,P,B

PRINCIPAL

I,P,B - 4:2:0

SIMPLE

I,P - 4:2:0

Perfiles

Niveles

Estándar MPEG-2• Organización del flujo de transporte

– Corriente elemental (flujo de video, audio, o datos)• Paquetes de corriente elemental (PES)• Longitud de paquete grande• Información sobre contenido, sincronización

– Multiplexión de corrientes elementales• Corriente de programa (PS)• Corriente de transporte (TS)

32

Estándar MPEG-2• Organización del flujo de transporte

Estándar MPEG-2

• Corriente de programa (PS)– Multiplexión simple intercalando PES– Útil en canales sin ruido (ej: DVD)– No necesita corrección de errores– Hasta 16 corrientes de vídeo y 32 de audio

• Todas deben tener la misma base de tiempos

33

Estándar MPEG-2

• Corriente de transporte (TS)– Entornos ruidosos (ej: difusión TV)– Paquetes cortos 188 Bytes– Técnicas de corrección de errores– Alberga varios programas de televisión

• Pueden tener diferente temporización• Puede llevar información de acceso condicional

– Flujo binario constante

Estándar MPEG-2

• Corriente de transporte (TS)

34

Aplicaciones de la compresión

• Producción en estudios de televisión• Periodismo electrónico• Transmisión y difusión de la señal de vídeo• Servidores de vídeo• Multimedia• Sistemas domésticos• Videoconferencia


• Producción en estudios de televisión– Reducción del coste de almacenaje– Alta multigeneración

• Necesidad de mantener muy alta calidad• Factores de compresión bajos

– MPEG-2 Perfil 4:2:2 para estudio• Regímenes binarios de 50 Mb/s (factor 3,3:1)• GOP pequeño: IBIBIB, IPBIPB

35


• Periodismo electrónico– Necesidad de portabilidad de equipos– Necesidad de reducir el consumo

• Utilización de formatos 4:1:1 y 4:2:0– Disminución de la multigeneración

• Compresión algo más alta. MPEG-2 (5:1, o 10/1)• Flujos binarios de 15 a 30 Mb/s


• Transmisión y difusión– Para transmisión con alta multigeneración

• Factores de compresión bajos (3,3:1)– Para difusión

• Escasa multigeneración• MPEG-2 Factores de compresión altos • Flujo binario calidad de estudio (9 Mb/s)• Flujo binario calidad PAL (5 Mb/s)

36


• Servidores de vídeo– Necesidad de gran almacenaje– Necesidad de rápido acceso

• Mucha competencia entre formatos• MPEG-2 dificultad de acceso con alta compresión


• Multimedia– Escasa capacidad de los ordenadores– Sistemas hardware de compresión escasos

• Algoritmos software, NO en tiempo real– Multigeneración escasa– Economía de utilización– Multitud de algoritmos de compresión

• Archivos AVI con MJPEG, MPEG-2, MPEG-4...

37


• Sistemas domésticos– MPEG-2 en DVD, y televisión digital

• Coste del decodificador bajo– Problema: coste del codificador

• Grabadores de DVD caros para tiempo real– Magnetoscopios

• Disminución del régimen binario reduce el coste• Necesidad de codificadores sencillos y económicos• Formato DV con baja compresión.


• Videoconferencia– Comunicación en dos direcciones

• MPEG-2 sin cuadros B– con cuadros B => excesivo retardo

• MPEG-4– Regímenes binarios muy bajos con calidad alta– Limitación en el movimiento de los objetos

38

Compresión en cascada

• Sucesivas compresiones y descompresiones• Con el mismo algoritmo

– Deterioro progresivo de la calidad• Si se utilizan algoritmos diferentes

– Deterioro imprevisible• Recomendación utilizar en toda la cadena

– Mismo método de compresión– Mismo factor

Bibliografía

• Mitchell, J.L. “MPEG Video Compression Standard” International Thompson Publishing” 1996.

• Ortiz Berenguer, L. “TV Digital: MPEG-2 y DVB”. Servicio Publicaciones UPM. 1999.

• Martín Marcos, A. “Televisión Digital Norma MPEG-2 (video)”. Ciencia 3. 1998.

Download - Tema 3 - UCLMetsiiab.uclm.es/~jmlova/Archivos/NT/Archivos/... · 2008-10-03 · –Minimiza redundancia espacial –Permite factor de compresión variable –Compresión subjetivamente

Top Related