internacionalización (i18n)
DESCRIPTION
Internacionalización (i18n). Pedro Valero Universidad de Valencia. Objetivos. Valorar la importancia de la internacionalización de las interfaces Re conocer los problemas derivados de la traducción a otros lenguajes y los diferentes alfabetos existentes - PowerPoint PPT PresentationTRANSCRIPT
Internacionalización (i18n)
Pedro ValeroUniversidad de Valencia
Objetivos
Valorar la importancia de la internacionalización de las interfaces
Reconocer los problemas derivados de la traducción a otros lenguajes y los diferentes alfabetos existentes
Saber cómo evaluar si el software está adecuadamente internacionalizado
Conocer los recursos técnicos sobre como internacionalizar las interfaces Conocer la internacionalización de las interfases
Conocer los alfabetos y esquemas de codificación
Contenidos
IntroducciónInternacionalización y localizaciónVentajasElementosEscrituraEsquemas de codificaciónModelo de internacionalización y
localizaciónGuia técnica
Introducción
Software internacional
Definiciones
Es un producto que esta preparado para ser vendido en un ámbito fuera de la región o país donde fue creado
En un sentido completo es si se puede vender en todo el mundo
Como veremos hay diferentes niveles de internacionalización
Internacionalización
Ventajas
Los productos se pueden colocar en el mercado mas fácilmente
El mantenimiento del código es más fácil si solo hay una versión
Internacionalización
Internacionalización Es el proceso de diseñar una aplicación de
tal manera que pueda adaptarse a diferentes lenguajes y regiones sin necesidad de cambiar el código
Localización Es el proceso de adaptar software para una
región especifica o lenguaje añadiéndole componentes específicos y traduciendo texto
Localización
Convenciones locales, la cultura y el lenguaje de una región particular
El conjunto de letras que se utilizan para escribir una lengua se dice escritura.
Cada localización solo tiene una escritura
Beneficios
Añadiendo la localización el mismo ejecutable funciona en todo el mundo
Los elementos textuales, como los mensajes o las etiquetas de los componentes no están en el código, están fuera y se cogen dinámicamente
Las dependencias culturales como fechas, monedas, aparecen en formatos que están acorde con la localización
Elementos
CulturaLengua habladaColoresNúmerosUnidades de medidaMonedasEscritura
Elementos
IconosTexto Audio clips Ayuda en línea Formato de moneda,
fechas y números Calendarios
Medidas Colores Gráficos Números de teléfono Direcciones Títulos honoríficos
Iconos
Mullet y Sano (1995) señalan que la comunicabilidad de cualquier representación depende de que haya un contexto compartido entre el que envía el mensaje y el que lo recibe que permita que los signos sean interpretados dentro de una lógica similar a la que fueron codificados.
Elementos
Cultura
La cultura de una región o pais puede hacer percibir un mismo objeto de dos maneras diferentes en puntos geográficos diferentes
Ejemplos Tan pronto como sea posible es
inmediatamente en Estados Unidos y puede ser este mes en la cultura latinoamericana
La mano izquierda es ofensiva en algunas culturas
Elementos
Cultura
Hay que cuidar como de dibujan hombres y mujeres juntos y como van vestidos
Algunos simbolos com la esvastica, martillo y hoz, sol naciente, cruces, estrellas representan ideas politicas y relogiosas
En un pais islámico puede entenderse como ofensivas cosas que en Occidente no tiene ningun significado Mover la cabeza, hacer adiós con la mano,
mujeroes en bikin, bebidas alcoholicas
Elementos
Colores
Tienen significado a través de la tradición en la mayor parte de las culturas Occidental
Negro es un color asociado con la muerte y con funeralesBlanco asociado con purezaVerde y azul frío y tranquiloRojo, caliente y símbolo de riesgo, peligro
OrientalBlanco asociado con la muerteRojo casamiento
Elementos
Colores
Cada cultura tiene sus estándares, por lo que es difícil generalizar
Semáforo Rojo (parar), ambar (precaución) i verde
(adelante), pero no tan solo estos los podemos asmuir de una manera generalizada
Elementos
Calendarios, formato y separadores de fecha y hora
Hay otros tipos de calendario aparte Gregoriano Budista, el chino, hebreo, etc...
Formato calendario gregoriano aa/mm/dd aa dos ultimos digitos del año aaddd mm mes aaaa/nn/dd dd dia dd/mm/aa aaaa año mm/dd/aa
Elementos
Formatos de números y monedas
Para cada país hace falta tener en cuenta el símbolo de la moneda y el formato numérico USA $1,234,56 Noruega kr1.234,56 Suiza sFr1234,56 Alemania 1.234,56DM Euro ?
Ordenación
Las ordenaciones son importantes en el proceso de internacionalización y un tema complejo
En un principio las ordenaciones de caracteres son de la A a la Z, mayúsculas primero y después las minúsculas, los número de ordenan de 0 a 9
Este tipo de regla no siempre es aceptable, porque hay reglas más complicadas cuando hay que considerar un segundo carácter al mismo tiempo
Ordenación en castellano
Malcaracola
chacal cura danza llama luna marmota
Biencaracola
cura chacal danza luna llama marmota
Ordenación en castellano
En castellano por ejemplo, ch es un doble caracter, que se ha tratar como un solo caracter y se ordena despues de la c y antes de la d. La ll es un doble caracter que tambíen hay que considerarlo como uno solo y se ordena despues de la l y antes de la m
Elementos específicos
Unidades de medida
La mayor parte del mundo utiliza el sistema métrico excepto Estados Unidos
Utiliza la milla, la pulgada, etc..
Zonas
Europea
Europa, oeste, central y este, griego, ruso, turco,indonesio
Un byte
Latin, griego, Cirílico
Izquierda a derecha
Oriente medio Arabe, Hebreo Un byte Arabe, Hebreo, Latin
Bidireccional
Extremo oriente
Chino tradicional, Chino simplificado, Japonés, Koreano
Multibyte
Kana, hangul, caracteres ideográficos
Horizontal y vertical
Thai Thai Un byte Thai Izquierda a derecha
Elementos
EscriturasLas escrituras se pueden clasificar en
ideogramas y escrituras fonéticas Un ideograma tien un significado especial y no
tiene relación con su pronuciación Las letras de una escritura fonética representan
determinados sonidos, como por ejemplo M
Los tres sistemas de escritura mas importantes son:
OccidentalesOriente medioOriente lejano
Escrituras Occidentales
Las escrituras occidentales son: Latín, griego y cirílico
Las siguientes características son comunes a las tres escrituras: Fonéticas
Se leen de izquierda a derecha en una línea horizontal
Utilizan letras mayúsculas y minúsculas diferentes
Utilizan numeración aràbiga 0,1,2,3,4,5,6,7,8,9
Escrituras
Extremo OrienteLas escrituras del oriente lejano estan
basados en caracteres ideográficos chinos
Los caracteres chinos son únicos, por su sistema especial de construcción, su larga história y su pronunciación
Su antigüedad se remonta a 4000 años y se utilizan de esta forma desde hace mas de 2000 años
Actualmente se utilizan unos cuantos miles de caracteres
Escrituras
Lejano oriente
Escrituras
Esquemas de codificación
Cada tipo de escritura ha de ser representada en sistemas informáticos
Esta representación se concreta en un esquema de codificación
Estos esquemas se codifican a través de mapas de caracteres
ASCIIEl mapa de carácteres ASCII consta de 128
carácteres Los caracteres en el rango de o a 31 y el carácter 127 son
especiales, tipicamente de controlCada carácter es un indice en el mapa de
caracteres, por ejemplo el número 65 es la letra A y el 97 la letra a
El codigo ASCII de 128 caracters solo se utilizaba para el inglés En principio con 128 caracteres habia bastante Al necesitar nuevos idiomas se empezó a utilizar el resto
de 128 caracteres
Tipos de esquemas de codificación
Mapa de caracteres de un octeto (SBCS)Mapa de caracteres de doble octeto
(DBCS)Unicode
Mapa de caracteres de un solo octeto (SBCS)
Son mapas de caracteres de hasta 256 caracteres (256 = 2^8).
Es una extensión del código ASCII, al que se han añadido 128 caracteres del 128 al 255
Se denomina mapa de caracteres extendido ISO
8859-2 Latín europa del este 8859-5 Cirilico Europa del este 8859-1 Latin Europa Oeste 8859-7 Griego 8859-3 Turco 8859-8 Hebreo 8859-6 Arabe
ISO 8859 - I Latin
ASCII ISO 8879
Mapa de caràcters de doble octeto (DBCS)
Las escrituras del extremo oriente utilizan caracteres ideográficos
Necesitan un mapa de caracteres mas grande de 256 caracteres
Para resolverlo se hizo el mapa de caracteres de doble octeto
Notación de 16 bits 65536 (2^16) caràcters
El DBCS de un solo octeto se corresponde con el código ASCII
Algunos caracteres se definen como octetos de comienzo y un segundo de código
Codigo KANJI
Codi KANJI
El codigo Kanji definido por el JIS (Japan Industry Standard JIS.). El JIS nivel I contiene alrededor de 3000 de los
caracteres mas normales El nivel 2 añade 3500 caracteres mas El tercer nivel se ha definido recientemente e
incrementa el mapa de caracteres en mas de 6000 caracteres
JIS está basado en un formato de 7 bits que requieren secuencias de ESCAPE especiales para entrar o salir del modo DBCS.
Problemas
Duplicidad en la codificación de caracteresMultiples códigos de caracteres incosistentes
debido al conflicto entre estándares nacionales y de la indústria
El código ASCII de 7 bits o el de 8 bits, estan limitados a 128 y 256 posiciones de código y son inadecuados en un entorno global
Internet ha añadido un punto más a la demanda de un conjunto de caracteres único en el mundo
Unicode
Unicode es una codificación de caracteres de 16 bits
Consensuado, participan Apple, Borland, Digital, Hewlett-Packard, IBM, Lotus,
Metaphor, Microsoft, Next, Novell, Research Libraries Group, Sun, WordPerfect, i Xerox
Se puede hacer un acceso aleatorio en los caracteres
Los programas no tienen que guardar estados al analizar cadenas
El codigo Unicode es único para un carácter determinado
Unicode
Unicode
UnicodeDisposición de símbolos i letras
Un modelo de localización
Recursoslocalizados
+Código de laaplicación
= Productolocalizado
Guía técnica
En esta parte de discuten problemas generales de conversiones a diferentes versiones del lenguaje y las diferentes necesidades que se preveen para planificar la localización
Desarrollo
Activación en el momento de la ejecución o al menos en el de la compilación
Puntos a revisar
Elementos específicos de la localización Convenciones en el procesamiento de texto
que incluye ordenació, classificació de caràcters,
pronunciación, guionado, funciones de gestión de cadenas e intercambio de ficheros (Importación y exportación de ficheros)
Gestión de las entradasGestión de les salidas
Traducción del texto
Todas las lenguas tienen gramática y sintaxis diferentes
El texto traducido cambia de tamaño, hay que prever que pueda crecer
Ejemplo: Mover se traduce como verschieben en
alemán 5 contra 11
Organización de diálogos (Layout)
La organización de controles y elementos en una ventana ha de considerar la expansión de las etiquetas de texto
En hebreo y árabe la información se escribe de derecha a izquierda (Hace falta invertir la presentación )
Algunos idiomas incluyen marcas diacríticas que requieren espació adicional
Permite un 30% de expansión
Barra de estado
La versión inglesa solo ha de ocupar el 50% de la barra de estado
Menús
Evitar menús muy densos Límite 80 caractere
Aceleradores coinciden con el primer carácter de una palabra
Desarrollo de codigo internacional
Documentar todos los recursos que tienen que ser localizados
Es útil hacer dos localizaciones en paralelo para poder evaluar la i18n
Es importante dispones de herramientas y utilidades para hacer la localización
Bibliografìa (1)
Apple Computer. Guide to Macintosh Software Localization. (1992)
Fernandez Tony. Global Interface Design: A Guide to Designing International User Interfaces. Boston A.P Professional (1995)
Galdo del. Eliza, Jakob Nielsen.International User Interfaces. John Wiley & Sons. (1996)
Kano Nadine, Microsoft Corporation.Developing International Software for Windows 95 and Windows NT. W.A Microsoft
Press. (1995) Martin O'Donnell Sandra. Programming for the World: A guide
to Internationalization. Prentice-Hall(1994)
Bibliografía (2)
Microsoft Press . The GUI Guide. International Terminology for the Windows Interface. Microsoft.(1993)
Uren Emmanuel, et al . Software Internationalization and localization. Van Nostrand Reinhold.(1993)
Addison and Wesley. The Unicode Standard; Worldwide Character Encoding
Volume I i II (ISBN 0-201-56788-1 and ISBN 0-201-60845-6).
Unicode Consortium . The Unicode Standard. (1991) Prespectives on Design and Internationalization. SIGCHI
Bulletin Vol 28. Enero 1996.
Enlaces
Internacionalització i Localització: Internationalization (Tutorial) Internationalization FAQ Internationalization of User Interfaces. Windows Interface Guidelines: Internationalization W3C Internationalization and Localization. Unicode: Unicode Home Page Java Tools: International classes for Unicode ASCII: ASCII-ISO8859 Java: Java Internationalization.
Conclusiones
La globalización de la economia es una realidad
Esta presentación pretende ser una puerta de entrada a la internacionalización
La internacionalización de interfases es una necesidad que hay que tener en cuenta al principio