n o debes descargar esa web para traducirla, y lo sabes... etim2015 noviembre de 2015 josé blanco...
TRANSCRIPT
NO DEBES DESCARGAR ESA WEB PARA TRADUCIRLA, Y LO SABES...
ETIM2015
Noviembre de 2015José Blanco Pérezwww.locdep.com
INTRODUCCIÓN
• Introducción al curso• Breve introducción a la web• Riesgos de descargar o copiar un sitio• Cómo minimizar riesgos• Formatos típicos
- ----------------------------------------• Ruegos y preguntas
Contenidos
Atención
Truco
Recomendación
Ejemplo
Información
ConvencionesOtros
• Dirigido a traductores• Muy condensado• 45 minutos
Por favor, selecciona la respuesta correcta:
Porque han arrestado de nuevo a Manuel Mata.
Porque Matt Damon tiene más tirón que AntonioCarmona.
Porque Manuel Mata asiste este fin de semana al FEM (Festival Erótico de Madrid).
Porque el Madrid ha ganado al Barcelonala semana pasada.
¿Por qué estoy yo con vosotros en vez de Manuel Mata™?
Pista: Una de las respuestas anteriores es incorrecta.
Sobre mí:
- Traductor / Desarrollador
- Ingeniero de localización
- Especialista en evaluaciones
- Consultor de localización
- Co-fundador de
- Certified Passolo Trainer
- Profesor en la UAX
1994
2006
2007
1999
2009
• Introducción a la localización
• Localización con SDL Passolo
• Traducción con SDL Passolo
• SDL Trados Studio (todos los niveles)
• Internacionalización de documentation
• Internacionalización de software
• Internacionalización de ayudas
• Locales, juegos de caracteres y codificaciones
• Macros para localizadores
• Introducción a la traducción automática
• XPath y Regex para traductores
• Localización de software
• Localización de ayudas
• Localización web
• Localización multimedia
• Localización de documentación
• Single-sourcing
• Evaluación y análisis de proyectos
• Fuentes y localización
• DITA y locaización
• XML para localizadores y traductores
• Control de calidad/Evaluación de calidad
Nuestros cursos
INTRODUCCIÓN A LA WEB
DNS (servidor de nombres de dominio) Todo dispositivo en red tiene una dirección IP El DNS transforma los nombres en IPs ¿Nombres de dominio multilingües? Con IRI
Navegador Plataforma y Aplicación
- Windows, Mac, Linux, Android, iPhone…- IE, Firefox, Opera, Safari, Chrome, Edge…
Servidor Web Aplicación que sirve páginas solicitadas
- IIS (Internet Information Services)- Apache TomCat
Localización web – Conceptos básicos
Base de datos
Código
DNS
Usuario Servidor Web
1 2 3
45
3
2
5
4
1 El usuario llama a un dominio: www.locdep.com
El DNS enruta la llamada a la dirección IP: 219.76.130.238
El servidor web procesa las páginas solicitadas
El servidor web sirve las páginas solicitadas
El usuario recibe HTML
Localización web – Conceptos básicos
Nube
Base de datos
Código
DNS
Usuario Servidor Web
1 2 3
45
Localización web – Conceptos básicos
Regla Número 2
Las webs están alojadas en servidores, en formatos complejos:- HTML, ASP, ASPX, JS, VBS, PHP, CFM- Bases de datos: mySQL, SQL, Oracle, Access
Regla Número 1
Se navega en Internet mediante navegadores, y siempre recibimos HTML.
Ver>Código fuente.
Regla Número 3
Los contenidos a los que accedemos y los originales no son los mismos.
≠
LOCALIZACIÓN WEB: DESCARGAS
¿Podrías traducir el siguiente sitio web:www.acme.com?
Solo tenemos la URL.
¿Podría recibir los archivos fuente u originales?
Bueno, no es seguro hacerlo así.
¿Por qué?
Localización web – ¿Descargar, copiar?
Eso, ¿por qué?
Si los demás lo hacen...
Los contenidos descargados no son los mismos que los que deben traducirse
Los navegadores solo procesan HTML Los archivos fuente pueden ser de todo tipo:
HTML, PHP, ASP, ASP.Net, SQL Server…
Localización web – ¿Por qué no se debe descargar un sitio web?
Localización web – ¿Por qué no se debe descargar un sitio web?
Los contenidos web son dinámicos
Los gestores de descarga solo pueden descargar lo que “ven”
Formularios dinámicos Capas ocultas Controles específicos Objetos en servidor Comportamientos (Mouse over)
Los contenidos web difieren según el navegador
Los gestores de descarga solo pueden descargar lo que «ven»
Se personaliza el código para los distintos navegadores No todos los navegadores interpretan y muestran el código igual
<!--[if IE 8]>
<style type="text/css">
/* css para IE 8 */
</style>
<![endif]-->
<!--[if lt IE 8]>
<link href="ie7.css" rel="stylesheet" type="text/css" /> <![endif]-->
Localización web – ¿Por qué no se debe descargar un sitio web?
Los contenidos web difieren según la plataforma
Los gestores de descarga solo pueden descargar lo que “ven”
Localización web – ¿Por qué no se debe descargar un sitio web?
Web en Flash en un PC Misma web en Flash en un iPad
Los contenidos web difieren según la plataforma y navegador
Los gestores de descarga solo pueden descargar lo que “ven”
Localización web – ¿Por qué no se debe descargar un sitio web?
Web en un PC Misma web en un iPhone
La mayor parte de la web está oculta No me refiero solo a deep web La mayoría de Internet está protegida por contraseña Los gestores de descarga no pueden descargar contenidos protegidos
Localización web – ¿Por qué no se debe descargar un sitio web?
Localización web – ¿Por qué no se debe descargar un sitio web?
Los sitios web “se protegen” de los gestores de descarga
Bots – Anti-bots CAPTCHA/ReCAPTCHA
(Completely Automated Public Turing TestTo Tell Computers and Humans Apart)
http://www.captcha.net/ https://www.google.com/recaptcha
Cabeceras (menús)
Lateral izquierdo
Pie
Los gestores descargan las páginas como un único bloque, no por módulos
Los gestores de descarga descargan cada página como una única página, sin tener en cuenta los elementos de los que estén hechas: las plantillas o páginas maestras, los complementos de JavaScript etc.
Eso lleva a muchas repeticiones falsas (luego veremos cómo tratarlas)
Partes comunes repetidas en todo el sitio (almacenadas en js)
Localización web – ¿Por qué no se debe descargar un sitio web?
Las imágenes mostradas y las originales suelen ser distintas Se muestran generalmente jpg, png y gif. No son editables. Los formatos originales, editables, suelen ser psd, ai, eps. Nuevo formato antiguo: split-depth gif
Localización web – ¿Por qué no se debe descargar un sitio web?
http://www.techtimes.com/articles/27890/20150121/split-depth-gifs-taking-over-internet.htm
Se entrega una copia de la web original, no una web multilingüe Los sitios web suelen ser multilingües Necesitan un mecanismo para mostrar un idioma determinado
Selección automática por el navegador (JavaScript) Selección manual Página de bienvenida
Necesitan un mecanismo para cambiar el idioma Cuadro de lista desplegable (con sus problemas de internacionalización)
Localización web – ¿Por qué no se debe descargar un sitio web?
Los caracteres copiados pueden ser distintos de los originales... Los navegadores interpretan los caracteres para mostrarlos:
á - á á - á á - á
Localización web – ¿Por qué no se debe descargar un sitio web?
Y además hay como unas etiquetas muy raras... Los archivos fuente tienen etiquetas, que no se ven en el navegador
Me llamo José. – Me llamo <b>José</b.
Localización web – Descargar un sitio web
Vale.
Ya sabes que nunca debe descargar o copiar una web para traducirla.
Ahora también sabes por qué no debes hacerlo.
Pero...
Te lo pedirán.
Y lo harás.
Y lo sabes...
DESCARGAR UN SITIO WEB
Localización web – Descargar un sitio web
Veamos cómo descargar una web de la forma más segura.
Y veamos qué pedir al cliente según el tipo de web.
Recomendaciones iniciales• Avisar de los problemas que hemos visto anteriormente• Preguntar cuál es el formato original o intentar reconocerlo• Pedir los archivos fuente “según el formato”• Definir los entregables• Preguntar sobre la estrategia de selección/cambio de idioma• Si no queda más remedio que descargar
– Hacerlo solo para estimaciones– Definir el alcance de la traducción (niveles, micrositios)– No descargar a mano sino utilizar gestores de descarga– Avisar de los problemas que hemos visto anteriormente
Localización web – Traducir un sitio web
Herramientas
1. HTTTrack• Gratuita• Mediante un asistente• www.htttrack.com
2. WebZip• Comercial (¿desfasada?)• Añade etiquetas en la cabecera• www.spidersoft.com/webzip
Se puede especificar los niveles de enlaces, la carpeta de destino, las contraseñas etc.
Crean sitios funcionales localmente, es decir, transforman las rutas absolutas en rutas relativas.
Localización web – Cómo descargar un sitio web
Cómo analizar un sitio web evitando repeticiones falsas
1. Descargarlo si se puede con dos herramientas
2. Extraer los contenidos repetidos
3. Analizar el contenido repetido
4. Pseudo-traducirlo y crear una memoria con el contenido repetido
5. Analizar el sitio web completo con la memoria
6. No considerar los 100% o ContextMatch
Palabras nuevas del contenido repetido
+ Palabras nuevas del sitio completo
= Estimación de sitio completo
Localización web – Análisis de un sitio descargado
Formatos típicos
1. HTML estático
2. HTML dinámico, PHP, CFM
3. ASP, ASPX – SQL Server, Oracle, mySQL, Access
4. Sistemas de gestión de contenidos (CMS)
5. Flash (cada vez menos) > HTML5
Localización web – Formatos
HTML
1. Sitios estáticos
2. Se reconocen por tener etiquetas estándar
3. Qué se traduce:- Archivos .htm y .html
4. Cómo se traduce:- Filtros estándar en todas las herramientas
<html>…</html>
Localización web – Formatos
DHTML, PHP, CFM
1. Sitios dinámicos
2. DHTML<script>function myFunction(){alert("Hello World!");}</script>
3. PHP<!DOCTYPE html> <meta charset=utf-8> <title></title><?php echo 'Hello World'; ?>
4. CFM<cfoutput>#VARIABLES.greeting# World!</cfoutput> </body> </html>
5. Qué se traduce:- Archivos .htm, .html, .php, .cfm, .js
6. Cómo se traduce:- Filtros estándar en todas las herramientas
que a veces hay que personalizar.
Localización web – Formatos
ASP, ASPX, Oracle, SQL Server, mySQL
1. Para aplicaciones empresariales
2. Generado con Microsoft Visual Studio
3. Capa de presentación, de negocios y de datos
4. Bases de datos1. Oracle
2. Microsoft SQL Server
5. Incluye muchos lenguajes/estándares/marcos de trabajo1. JavaScript
2. Json
3. JQuery
4. Ruby On Rails
5. Ajax
6. Flex
7. Silverlight (RIP)
Localización web – Formatos
ASP, ASPX, Oracle, SQL Server, mySQL
1. Cómo se reconocen:1. http://www.demo.com/Index.aspx
2. http://www.demo.com/Login (MVC)
2. Qué archivos se traducen:1. .ASP o .ASPX
2. .RESX
3. .CSHTML
4. Bases de datos
3. Cómo se traducen:1. Filtros estándar y personalizados
2. Volcados de base de datos
Localización web – Formatos
Sistemas de gestión de contenidos (CMS)
Separan el contenido del formato
Contenidos: almacenados en una base de datos
Formato: almacenado en plantillas Constan de un sitio de administración y de un sitio público Sirven para blogs, noticias etc. Cómo se traducen
Mediante complementos Mediante resx Mediante archivos exportados Mediante volcados de base de datos
Algunos son de pago y otros (muchos) gratuitos (y open source)- Múltiples extensiones, plugins- Comunidad activa
Localización web – CMS
Joomla
Sitio principal: http://www.joomla.org Ejemplos:
- www.unric.org- http://www.businesstoday-eg.com/
Drupal
Sitio principal: http://www.drupal.org Ejemplos:
- http://www.economist.com/- http://www.whitehouse.gov/
Localización web – CMS
Alfresco
Sitio principal: http://www.alfresco.com Ejemplos:
- NASA Langley Research Center
Wordpress
Sitio principal: http://www.wordpress.org Cómo se reconoce: ver código fuente> wp Ejemplos:
- http://www.husainbolt.com/- http://www.variety.com
Localización web – CMS
Blogger
Sitio principal: http://--.blogspot.com Ejemplos:
- http://blogsofnote.blogspot.com.es/
Localización web – CMS
Tiendas en línea Sitios completos o plugins Cómo se traducen: mediante base de datos Ofrecidos por los principales proveedores de acceso a
Internet- Ejemplo: http://www.arsys.es
Ejemplos- osCommerce- Magento- Zen Cart
Localización web – CMS
Adobe Flash Desde animaciones sencillas hasta sitios completos o formación en línea (eLearning) Banners Programados en fla, generan
- swf- exe
El HTML llama al SWF Problemas
- Seguridad- Actualizaciones
Futuro (presente)- Desaparecerá en breve (lo digo cada año)- > HTML5
Localización web – Contenidos multimedia
HTML5 Quinta revisión de HTML (2012) Busca la compaibilidad
- Navegadores, plataformas- HTML4, XHTML1 y DOM Level 2 HTML
Vídeo, Audio, SVG, MathML Incluye línea de tiempo Editado, generado por:
- Adobe Flash CS6 y superior- Adobe Edge- Microsoft Visual Studio 2013 y superior
Para saber más- http://html5center.sourceforge.net/- https://developer.mozilla.org/es/demos/tag/tech:html5
Ejemplos: http://html5demos.com/svg-clock http://html5demos.com/drag
Localización web – Contenidos multimedia
Los contenidos localizados no sirven si no se pueden encontrar.
Servicio “nuevo” No se trata de traducción sino de adaptación Políticas de dominio
- www.domain.com > www.domain.es- www.es.domain.com- www.domain.com/es
Selección de idiomas Distintos niveles
- Informes- Traducción de palabras clave- Enlaces localizados (localized linking)
Localización web – SEO
Motores de búsqueda dentro de los sitios
Nuevo servicio (ingeniería) Indexación de contenidos localizados Google Search o software específico
Localización web – Motores de búsqueda
Accesibilidad web
Accesibilidad de navegadores (compatibilidad) vs accesibilidad Permite a los usuarios con discapacidad(es) acceder a contenidos web Lista de comprobación para sitios web accesibles Herramientas para comprobar la accesibilidad (
http://www.w3.org/WAI/ER/tools/complete)
Localización web – Accesibilidad
Bases de datos
1. Microsoft SQL Server
2. Oracle
3. mySQL
Localización
1. Volcado a texto/Excel
2. Consultas/Script (Select FROM/Insert TO)
3. Conexión ODBC (Passolo)
Localización web – Formatos
Adobe Flash
1. Descompilación (Sothink/Avral)
2. Texto estático
- Redimensionamiento dinámico/estático
3. Tablas de localización dinámicas
- Redimensionamiento dinámico/estático
4. Componentes de terceros
5. Estrategia de cambio de idioma
- Idioma de la escena
- Idioma del sistema operativo
Localización web – Formatos
HTML5
1. Filtro estándar + personalización
2. JS: Filtro estándar + personalización
3. SVG: filtro estándar
TURNO DE PREGUNTAS
...Y GRACIAS