unidad 1) lenguajes de marcas - jorge...

24
LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, www.jorgesanchez.net @jorgesancheznet Unidad 1) Lenguajes de marcas LMSGI, módulo del ciclo de FP de Grado Superior, Administración de Sistemas Informáticos en Red

Upload: others

Post on 10-Apr-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Unidad 1) Lenguajes de marcas

LMSGI, módulo del ciclo de FP de Grado Superior, Administración de Sistemas Informáticos en Red

Page 2: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

1.1) ordenador e información

LMSGI, módulo del ciclo de FP de Grado Superior, Administración de Sistemas Informáticos en Red

Page 3: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

¿Qué significa que el ordenador es una máquina digital?

•Representa los datos con unos y ceros

Page 4: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

¿Siempre ha sido digital?

Page 5: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

¿Qué información es representable por una computadora?

• Imágenes•Texto•Música•Vídeos•Mapas•….. cualquier cosa si la convertimos en unos y ceros

Page 6: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Formas de representar información en el ordenador

• El ordenador es una máquina binaria• TODA la información que almacena debe ser almacenada de forma

binaria• Nº 9701100001• Letra A01000001

• Color Malva211 174 25211010011 10101110 111111000• Una imagen Pasar todos los píxeles a binario• Vídeo, sonido Muestras de cada sonido e imagen• Codificación=Transformación de información a una forma binaria

Page 7: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Datos binarios y datos de texto

• En realidad todo es binario• Datos binarios = (Comúnmente) Todo lo que no es texto• Los humanos alfabetizados estamos muy textualizados• Ejemplo. Intentar ver lo siguiente sin entender lo que pone,

como si fuera una mancha de color blanco:

Page 8: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Datos binarios y datos de texto

• Los humanos no podemos abstraernos así• Para el ordenador la imagen inferior sólo es una secuencia

binaria más• Para el ser humano, alfabetizado en caracteres latinos, es

claramente un texto

Page 9: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto

•Un ordenador solo maneja datos binarios

•Consecuencia: El texto debe de convertirse en binario

Page 10: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto

•Problema:•ñ (en sistema Windows clásico) = 241 = 11101101•ñ (en la consola clásica de Windows) = 164= 10100100

•Cada sistema codificaba de una manera

Page 11: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

1.2) codificación de texto a binario

LMSGI, módulo del ciclo de FP de Grado Superior, Administración de Sistemas Informáticos en Red

Page 12: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto.código ASCII

•ANSI creó una tabla llamada ASCII que estandarizó la forma de codificar texto•La tabla consta de 128 caracteres•Usa 7 bits para codificar•Problema: Sólo incluyó caracteres del inglés

Page 13: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto.código ASCII•Para los símbolos no ingleses, se añadió un bit más al ASCII = 256 caracteres•ASCII extendido=8 bits•Problema: Hay muchos ASCII extendidos

Page 14: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto.código Unicode• Intenta arreglar el lío de los sistemas ASCII extendidos•Cada símbolo de cada lengua tiene un valor•Usa hasta 32 bits (caben billones de caracteres)•Problema: El tamaño de los archivos de texto se multiplica

Page 15: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto.código Unicode. implementaciones• UTF-8:• Tamaño variable para cada carácter (8,16,24 o 32 bits)• 8 bits Caracteres del código ASCII original• 16 bits Lenguas latinas, cirílicas, griegas, árabes, hebreas

y otras de Europa, Asia Menor y Egipto• 24 bits Resto de símbolos alfabéticos (lenguas de Asia)• 32 bits Símbolos, lenguas muertas,…

Page 16: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

el problema de codificar texto.código Unicode. implementaciones•UTF-16• Ocupan 16 (si son del tipo 1 y 2 anterior) y 32 bits

•UTF-32• Cada carácter ocupa 32 bits

Page 17: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Códigos. Unicode. Implementaciones

• Ejemplo, texto 取得cigüeña𐐝• En UTF-8 ocupa: 3+3+1+1+1+2+1+2+1+4 = 19 bytes• En UTF-16 ocupa: 4+4+2+2+2+2+2+2+2+4 = 26 bytes• En UTF-32 ocupa: 4+4+4+4+4+4+4+4+4+4 = 40 bytes

• UTF-8 ocupa menos, pero el proceso de los archivos es más lento• UTF-32 es el que más ocupa pero el proceso es simple• UTF-8 es la forma más usada, es el estándar actual para

codificar texto

Page 18: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Ventajas de los archivos binarios

•Ocupan menos espacio

•Son más rápidos de procesar por la máquina

•Permiten el acceso directo a los datos

•Los datos que almacenan no están expuestos

Page 19: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

Ventajas de los archivos de texto

• Ideales para exportar e importar•Compatibles con cualquier dispositivo•Directamente modificables•Manipulación sencilla•Directamente transportables y entendibles por todo tipo de redes

Page 20: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

1.3) exportar/importar datos

LMSGI, módulo del ciclo de FP de Grado Superior, Administración de Sistemas Informáticos en Red

Page 21: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

El problema de compartir datos

• Datos que he creado en una aplicación, los quiero en otra

• En binario Conversores de formato

• Ejemplo foto:• JPG• TIFF• PSD• GIF• PNG

Page 22: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

El problema de compartir datos

•Primera solución: estándares

•Música MP3

• Imagen JPG

•Documentos PDF

•Todos tienen matices y todos están expuestos a que aparezca un formato mejor

•En muchas ocasiones son propiedad de empresas

Page 23: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

El problema de compartir datos

¡El texto siempre es estándar!

Page 24: Unidad 1) Lenguajes de marcas - Jorge Sanchezjorgesanchez.net/presentaciones/lenguajes-de-marcas/...LMSGI-Unidad 1-Lenguajes de marcas Jorge Sánchez, @jorgesancheznet el problema

LMSGI-Unidad 1-Lenguajes de marcasJorge Sánchez, www.jorgesanchez.net

@jorgesancheznet

El problema de compartir datos

Problema:¿Cómo meter datos no textuales (vídeo, imagen, sonido,…) en archivos de texto?