digitalización y formatos de video

9
Formatos de archivos de vídeo Los videos digitales se pueden guardar en archivos de distintos formatos. Cada uno se corresponde con una extensión específica del archivo que lo contiene. Existen muchos tipos de formatos de video. Aquí se citan algunos de los más utilizados. Asimismo cada tipo de archivo admite en cada momento un códec de compresión distinto. AVI (Audio Video Interleaved = Audio y Video Intercalado) - Es el formato estándar para almacenar video digital. - Cuando se captura video desde una cámara digital al ordenador, se suele almacenar en este formato con el códec DV (Digital Video). - El archivo AVI puede contener video con una calidad excelente. Sin embargo el peso del archivo resulta siempre muy elevado. - Admite distintos códecs de compresión como CinePak, Intel Indeo 5, DV, etc. Los códecs con más capacidad de compresión y una calidad aceptable son DivX y XviD. - El formato AVI puede ser visualizado con la mayoría de reproductores: Windows Media, QuickTime, etc. siempre y cuando se encuentren instalados en el equipo los adecuados códecs para cada tipo de reproductor. - Es ideal para guardar videos originales que han sido capturados de la cámara digital (codificados con DV). - No es recomendable publicarlos en Internet en este formato por su enorme peso. - Los códecs CinePak, Intel Indeo, DV, etc. no ofrecen una gran compresión. Los códecs DivX y XviD por el contrario consiguen una óptima compresión aunque se suelen destinar sobre todo a la codificación de películas de larga duración. MPEG (Moving Pictures Expert Group = Grupo de Expertos de Películas) - Es un formato estándar para la compresión de video digital. - Son archivos de extensión *.MPG ó *.MPEG. - Admite distintos tipos de códecs de compresión: MPEG-1 (calidad CD), MPEG-2 (calidad DVD), MPEG-3 (orientado al audio MP3) y MPEG- 4 (más orientado a la web). - Se reproducen con Windows Media Player y QuickTime. MOV (http://www.apple.com/es/quicktime/) - Es el formato de video y audio desarrollado por Apple. - Utiliza un códec propio que evoluciona en versiones con bastante

Upload: carlos-villagran

Post on 12-Jan-2016

3 views

Category:

Documents


0 download

DESCRIPTION

formatos de video y teoria sobre digitalizacion

TRANSCRIPT

Page 1: Digitalización y Formatos de Video

Formatos de archivos de vídeo

Los videos digitales se pueden guardar en archivos de distintos formatos. Cada uno se corresponde con una extensión específica del archivo que lo contiene. Existen muchos tipos de formatos de video. Aquí se citan algunos de los más utilizados. Asimismo cada tipo de archivo admite en cada momento un códec de compresión distinto.

AVI (Audio Video Interleaved = Audio y Video Intercalado)- Es el formato estándar para almacenar video digital.- Cuando se captura video desde una cámara digital al ordenador, se suele almacenar en este formato con el códec DV (Digital Video).- El archivo AVI puede contener video con una calidad excelente. Sin embargo el peso del archivo resulta siempre muy elevado.- Admite distintos códecs de compresión como CinePak, Intel Indeo 5, DV, etc. Los códecs con más capacidad de compresión y una calidad aceptable son DivX y XviD.- El formato AVI puede ser visualizado con la mayoría de reproductores: Windows Media, QuickTime, etc. siempre y cuando se encuentren instalados en el equipo los adecuados códecs para cada tipo de reproductor.- Es ideal para guardar videos originales que han sido capturados de la cámara digital (codificados con DV).- No es recomendable publicarlos en Internet en este formato por su enorme peso.- Los códecs CinePak, Intel Indeo, DV, etc. no ofrecen una gran compresión. Los códecs DivX y XviD por el contrario consiguen una óptima compresión aunque se suelen destinar sobre todo a la codificación de películas de larga duración.

MPEG (Moving Pictures Expert Group = Grupo de Expertos de Películas)- Es un formato estándar para la compresión de video digital.- Son archivos de extensión *.MPG ó *.MPEG.- Admite distintos tipos de códecs de compresión: MPEG-1 (calidad CD), MPEG-2 (calidad DVD), MPEG-3 (orientado al audio MP3) y MPEG-4 (más orientado a la web).- Se reproducen con Windows Media Player y QuickTime.

MOV (http://www.apple.com/es/quicktime/)- Es el formato de video y audio desarrollado por Apple.- Utiliza un códec propio que evoluciona en versiones con bastante rapidez.- Este tipo de archivos también pueden tener extensión *.QT- Se recomienda utilizar el reproductor de QuickTime. Existe una versión gratuita del mismo que se puede descargar de Internet.- Es ideal para publicar videos en Internet por su razonable calidad/peso.- Admite streaming.

WMV (http://www.microsoft.com/windows/windowsmedia/es/)- Ha sido desarrollado recientemente por Microsoft.- Utiliza el códec MPEG-4 para la compresión de video.- También puede tener extensión *.ASF- Sólo se puede visualizar con una versión actualizada de Windows Media 7 o superior. Esta aplicación viene integrada dentro de Windows.- Es ideal para publicar videos en Internet por razonable calidad/peso.- Admite streaming.

RM (http://spain.real.com/)- Es la propuesta de Real Networks para archivos de video.

Page 2: Digitalización y Formatos de Video

- Utiliza un códec propio para comprimir el audio.- Este tipo de archivos tiene extensión *.RM y *.RAM.- Se visualiza con un reproductor específico: Real Player. Existe una versión gratuita del mismo que se puede descargar de Internet.- Se puede utilizar para publicar videos en Internet por su aceptable calidad/peso.- Admite streaming.

FLV (http://www.adobe.com)- Es un formato que utiliza el reproductor Adobe Flash para visualizar vídeo en Internet.- Utiliza el códec Sorenson Spark y el códec On2 VP6. Ambos permiten una alta calidad visual con bitrates reducidos.- Son archivos de extensión *.FLV.- Se pueden reproducir desde distintos reproductores locales: MPlayer, VLC media player, Riva, Xine, etc.- Opción recomendada para la web por su accesibilidad. Al visualizarse a través del reproductor de Flash es accesible desde la mayoría de los sistemas operativos y navegadores web.- Los repositorios de vídeo más conocidos en Internet utilizan este formato para la difusión de vídeos: YouTube, Google Video, iFilm, etc.- Permite configurar distintos parámetros del vídeo para conseguir una aceptable calidad/peso.- Admite streaming.

FUENTE: http://www.ite.educacion.es/formacion/materiales/107/cd/video/video0102.html

-----------------------------------------------------------------------------------------------------------------------

Proporciones de aspecto de píxeles y de pantalla

En vídeo digital se utilizan dos tipos de proporciones de aspecto: proporciones de aspecto de píxeles y proporciones de aspecto de pantalla (también denominadas proporciones de aspecto de fotogramas). Aunque están relacionadas, describen propiedades distintas. La proporción de aspecto de píxeles describe las dimensiones de píxeles dentro de la pantalla, mientras que la proporción de aspecto de pantalla detalla la relación de las dimensiones de pantalla.

Proporciones de aspecto de píxelesLas proporciones de aspecto de píxeles describen la proporción entre el ancho y el alto de los píxeles que componen un archivo de vídeo o de imágenes fijas. Los píxeles pueden ser cuadrados o no cuadrados (rectangulares). El tipo de píxeles de una imagen, en combinación con sus dimensiones, determinan la proporción de aspecto de pantalla. Por ejemplo, un vídeo NTSC de 720 x 480 píxeles se visualiza como pantalla ancha si contiene píxeles no cuadrados con una proporción de 1,22, y como pantalla 4:3 normal si contiene píxeles no cuadrados con una Proporción de 0,9. encore permite especificar la proporción de aspecto de píxeles de los recursos importados.El vídeo de alta definición y las imágenes fijas tienen proporciones de aspecto de píxeles cuadrados de 1:1, o bien, una proporción de aspecto de píxeles anamórfica de 1,333. Hay tres tamaños (1280 x 720 ó 1920 x 1080 con proporciones de aspecto cuadrado y 1440 x 1080 píxeles con proporciones de aspecto anamórfico) y se ajustan a una proporción de aspecto de pantalla de 16:9.

Proporciones de aspecto de pantallaLas proporciones de aspecto de pantalla (también conocidas como proporciones de aspecto de fotogramas) describen la proporción entre el ancho y el alto de una imagen o dispositivo. Una televisión estándar tiene una proporción de 4:3 (denominada pantalla completa) y una televisión de pantalla ancha tiene una proporción de 16:9.

Page 3: Digitalización y Formatos de Video

Para estas proporciones también se utiliza la notación 1,33 para la pantalla completa (4/3 = 1,33) y 1,78 para la pantalla ancha. (La película, que está formada en su mayor parte por contenido de pantalla ancha, utiliza en realidad proporciones de aspecto de pantalla que oscilan entre 1,66 y 1,85, o incluso 2,35 para material de archivo en formato scope, pero todas ellas funcionan bien dentro del formato y se pueden considerar de pantalla ancha.)Hay dos factores que determinan la proporción de aspecto de pantalla: la resolución de la imagen y el tamaño de los píxeles que contiene, o proporción de aspecto de píxeles. Dado que la resolución de un recurso concreto es constante (por ejemplo, 720 x 480), Encore define las proporciones de aspecto de pantalla según la proporción de aspecto de píxeles del recurso.

FUENTE: http://help.adobe.com/es_ES/EncoreDVD/3.0/help.htmlcontent=WSbaf9cd7d26a2eabfe807401038582db29-7fb1.html

------------------------------------------------------------------------------------------------------------------------

Muestreo y Cuantificación

Cuantificación de imágenes I Las imágenes reales son continuas. Para poder trabajar con ellas con un ordenador, será necesario digitalizarlas. Este proceso comprende dos fases principales: el muestreo y la cuantificación. El muestreo es la parte encargada de integrar en puntos la información que se halla en un área determinada. Estos puntos en los que se integra el área son los elementos más pequeños en que se divide una imagen: los píxeles (Picture Elements). Una vez muestreada la imagen, será necesario codificar digitalmente el color integrado en cada píxel. Esta codificación de colores es lo que se denomina 'cuantificación' de la imagen. La meta de la cuantificación es cambiar la resolución de color de una imagen (número de bits en la representación del color) con una distorsión mínima. A la hora de codificar digitalmente una imagen, desarrolla un papel fundamental el número de bits utilizados para ello. Los colores presentes en la imagen pueden obtenerse como mezcla de tres colores básicos o primarios, según el sistema de colorimetría empleado. El sistema más extendido es el RGB, que se basa en los tres colores primarios: Rojo, Verde y Azul. Así, la codificación del color de un píxel se realizará dando un determinado peso a cada una de estas tres componentes. Este peso deberá ser codificado en digital. Será necesario, por lo tanto, codificar cada componente de color con un determinado número de bits. Si por ejemplo decidimos codificar cada componente con 8 bits, obteniendo 256 niveles de color posibles para cada una de las componentes, necesitaríamos 24 bits para codificar el color de cada uno de los píxeles. Estos 24 bits nos dan la posibilidad de alcanzar hasta 16,7 millones de colores diferentes. Hemos de tener en cuenta, sin embargo, que será necesario guardar nuestra imagen en un medio de almacenamiento. Si suponemos una imagen de tamaño normal que podría tener unas dimensiones de 512x256 píxeles, serían necesarios: 512x256x8x3=3 Mb Este es un espacio considerable si tenemos en cuenta que en ocasiones es necesario almacenar grandes cantidades de archivos de imágenes. Dado que es necesario discretizar el rango de colores disponibles en la naturaleza (que es infinito), el número de colores resultante es un conjunto finito, y por tanto la calidad del color se ve reducida. Si el conjunto de colores es lo suficientemente amplio, la pérdida de calidad en el color puede ser casi imperceptible. Sin embargo, al reducir mucho el número de bits, pueden aparecer falsos contornos (globo.jpg, moonvenus.jpg, sky.jpg), es decir, bordes inexistentes en la imagen original, también llamados 'artefactos'.

Cuantificación de imágenes II No obstante, existen formas de reducir el tamaño de almacenamiento de la imagen, sin que las

Page 4: Digitalización y Formatos de Video

variaciones sean sensibles al ojo humano. Estas formas se basan en varios comportamientos observados en la visión humana. Existen dos tipos de células sensibles a la luz situadas en la retina. Debido a su forma, estas células se denominan conos y bastones. Los conos se concentran en una región cerca del centro de la retina llamada fóvea, y son aproximadamente 6 millones; algunos de ellos tienen una terminación nerviosa que va al cerebro. Son los responsables de la visión del color. Existen tres tipos de conos, sensibles a los colores rojo, verde y azul, respectivamente. Esta es la razón por la que uno de los sistemas colorimétricos más utilizados sea el RGB. Los conos, dada su forma de conexión a las terminaciones nerviosas que se dirigen al cerebro, son los responsables de la definición espacial. Además son poco sensibles a la intensidad de la luz y proporcionan visión fotópica (visión a altos niveles). Los bastones son los responsables de la visión escotópica (visión a bajos niveles). La cantidad de bastones se sitúa alrededor de 100 millones y no son sensibles al color. Los bastones son mucho más sensibles que los conos a la intensidad luminosa y son los responsables de la visión nocturna. Son, además, los encargados de la percepción de imágenes monocromáticas, y dado que son mucho más numerosos el ojo es más sensible a este tipo de imágenes. Estudiando el comportamiento de la visión humana, se ha llegado a las siguientes conclusiones: - El ojo solamente es capaz de discriminar el brillo de entre 10 a 15 niveles de grises diferentes, siendo, sin embargo, muy sensible a la diferencia de brillo entre tonos adyacentes (escalera.jpg, bodegon1bn.jpg, bodegon2bn.jpg).- El ojo humano muestra una respuesta no lineal a los distintos colores, siendo más sensible a la zona azul (experimento.jpg) del espectro (455-492 nm), moderadamente sensible a la zona verde (492-577 nm) y menos sensible a la zona de los rojos (622-780 nm).

Por esto, podemos hacer distintas consideraciones dependiendo de si trabajamos con imágenes monocromas o en color. Las imágenes monocromáticas son aquellas que se representan utilizando los valores disponibles en una escala de grises. Si utilizamos niveles de cuantificación posibles, siendo b el número de bits disponibles, teniendo en cuenta el aspecto subjetivo, sería necesario reducir bastante el número de bits de cuantificación para apreciar diferencias notables en zonas homogéneas, obteniéndose resultados óptimos con un número de bits relativamente pequeño (aprox. 4 bits= 16 niveles). Las imágenes en color son aquellas que se representan utilizando cualquier conjunto finito de colores obtenidos mediante la combinación de diferentes cantidades discretas de rojo, verde y azul. Teniendo en cuenta la distinta percepción de ellos, es usual dar distinta importancia a cada una de las componentes cromáticas básicas en el sistema R G B. Pero además, existe otra técnica denominada cuantificación no uniforme, que consiste en utilizar menos niveles de gris en las transiciones bruscas y más niveles en las transiciones suaves, para evitar la aparición de falsos contornos. Para utilizar esta técnica es necesario que el algoritmo reconozca los contornos.

Cuantificación de imágenes III Una posible solución podría ser la cuantificación en bandas, dividiendo los posibles niveles de gris en intervalos. La banda que posea un mayor número de posibles valores, necesitará mayor número de niveles distintos, mientras que en otras con menos valores, se utilizarán menos niveles. Esto se traduce en una expansión y compresión de las bandas. El indicador será la ocurrencia de valores dentro de una banda, aunque podría contemplarse la ocurrencia y repetición. La evaluación de los resultados de la cuantificación es subjetiva, por lo que se podrán obtener mejores resultados al distribuir de distinta manera un mismo conjunto discreto de colores disponibles. En el applet podemos encontrar ejemplos del efecto de la cuantificación sobre distintas imágenes. Al experimentar la cuantificación con las imágenes 'Globo.jpg', 'Moonvenus.jpg' o 'Sky.jpg', podemos apreciar claramente la aparición de falsos contornos, o artefactos al reducir la

Page 5: Digitalización y Formatos de Video

cuatificación. Al reducir los bits de cuantificación a 4, observamos que, mientras que la zona del globo permanece casi con la misma calidad que en la imagen original, en la zona del cielo azul aparecen contornos que realmente no existen en la imagen inicial. Sin embargo en zonas con transiciones bruscas de color (zonas con muchos colores bien diferenciados), la imagen a penas pierde calidad subjetiva. En estas imágenes, la cuatificación no uniforme, comentada anteriormente daría muy buen resultado. Si concedemos más peso a la componente de azul y algo menos a las otras dos, las zonas de transición de azul suaves serían cuantificadas con más fidelidad y la pérdida de calidad subjetiva sería menor. En 'escalera.jpg', vemos una imagen con tonos de gris muy variados, y no existen zonas demasiado homogéneas o transiciones suaves de color, lo cual nos llevaría a la aparición de artefactos. Debido a la ausencia de estas zonas, podríamos permitirnos reducir la cuantificación de la imagen a 4, e incluso 3 bits, sin perder calidad subjetiva. La imagen 'bodegon1bn.jpg' y 'bodegon2bn.jpg', vienen a corroborar lo dicho anteriormente. Si en la imagen 'escalera.jpg' a penas encontrábamos transiciones suaves de gris, en cualquiera de estas dos imágenes son bastante apreciables. Concretamente en estas imágenes, encontramos un efecto muy particular. Al cuantificar la imagen con 4 bits, a penas notamos descenso en la calidad subjetiva, sin embargo, al bajar la cuantificación a 3 bits, la calidad desciende muy notablemente. Esto es debido a que los degradados de gris que aparecen en la imagen se desarrollan en casi todo el espectro de grises. Es decir, cualquier degradado de gris que encontramos va desde blanco hasta casi negro en zonas más o menos pequeñas. Debido a esto, al reducir los bits de cuantificación a 4 (16 niveles), aún tenemos valores de gris disponibles como para aproximar el degradado sin demasiadas pérdidas subjetivas. Sin embargo, al reducir el número de bits a 3 (7 niveles), el número de niveles es demasiado bajo, y comienzan a manifestarse contornos en la imagen. La imagen 'experimento.jpg', nos permite observar la distinta sensibilidad del ojo a cada una de las tres componentes RGB de una imagen. Observamos en esta imagen tres transiciones suaves de los colores rojo, verde y azul. Podemos comprobar como el ojo es, en primer lugar, más sensible a las transiciones de azul, como se dijo anteriormente. Al cuantificar la imagen con 5 bits, ya somos capaces de apreciar contornos o artefactos en la banda azul, mientras que las bandas roja y verde, que han sido cuantificadas de igual manera, no parecen tener pérdidas.

FUENTE: https://velorektesis.files.wordpress.com/2009/09/1-4-cuantificacion-de-imagenes.pdf

-----------------------------------------------------------------------------------------------¿Qué son los codecs?Códec es una abreviatura de Codificador-Descodificador. Describe una especificación desarrollada en software, hardware o una combinación de ambos, capaz de transformar un archivo con un flujo de datos (stream) o una señal. Los códecs pueden codificar el flujo o la señal (a menudo para la transmisión, el almacenaje o el cifrado) y recuperarlo o descifrarlo del mismo modo para la reproducción o la manipulación en un formato más apropiado para estas operaciones. Los códecs son usados a menudo en videoconferencias y emisiones de medios de comunicación.La mayor parte de códecs provoca pérdidas de información para conseguir un tamaño lo más pequeño posible del archivo destino. Hay también codecs sin pérdidas (lossless), pero en la mayor parte de aplicaciones prácticas, para un aumento casi imperceptible de la calidad no merece la pena un aumento considerable del tamaño de los datos. La excepción es si los datos sufrirán otros tratamientos en el futuro. En este caso, una codificación repetida con pérdidas a la larga dañaría demasiado la calidad.Muchos archivos multimedia contienen tanto datos de audio como de vídeo, y a menudo alguna referencia que permite la sincronización del audio y el vídeo. Cada uno de estos tres flujos de datos puede ser manejado con programas, procesos, o hardware diferentes; pero para que estos streams sean útiles para almacenarlos o transmitirlos, deben ser encapsulados juntos. Esta función es realizada por un formato de archivo de vídeo (contenedor), como .mpg, .avi, .mov, .mp4, .rm, .ogg, .mkv o .tta. Algunos de estos formatos están limitados a

Page 6: Digitalización y Formatos de Video

contener streams que se reducen a un pequeño juego de codecs, mientras otros son usados para objetivos más generales.Un endec es un concepto similar (pero no idéntico) para el hardware.La compresión de vídeo es una ciencia y un arte; todos los codecs tienen multitud de parámetros de configuración y podemos observar unas variaciones enormes en el resultado final según como configuremos dichos parámetros.En resumen, el codec es solo una de las piezas; una aplicación de codificación buena es aquella que sea capaz de utilizar todas las opciones del codec y ajustarlas correctamente.

FUENTE: https://seguinfo.wordpress.com/2007/07/22/%C2%BFque-son-los-codecs-2/