Title: Internacionalizaci
1Internacionalización (i18n)
Pedro Valero Universidad de Valencia
2Objetivos
- Valorar la importancia de la internacionalización
de las interfaces - Reconocer los problemas derivados de la
traducción a otros lenguajes y los diferentes
alfabetos existentes - Saber cómo evaluar si el software está
adecuadamente internacionalizado - Conocer los recursos técnicos sobre como
internacionalizar las interfaces Conocer la
internacionalización de las interfases - Conocer los alfabetos y esquemas de codificación
3Contenidos
- Introducción
- Internacionalización y localización
- Ventajas
- Elementos
- Escritura
- Esquemas de codificación
- Modelo de internacionalización y localización
- Guia técnica
4Introducción
5Software internacionalDefiniciones
- Es un producto que esta preparado para ser
vendido en un ámbito fuera de la región o país
donde fue creado - En un sentido completo es si se puede vender en
todo el mundo - Como veremos hay diferentes niveles de
internacionalización
6InternacionalizaciónVentajas
- Los productos se pueden colocar en el mercado mas
fácilmente - El mantenimiento del código es más fácil si solo
hay una versión
7Internacionalización
- Internacionalización
- Es el proceso de diseñar una aplicación de tal
manera que pueda adaptarse a diferentes lenguajes
y regiones sin necesidad de cambiar el código - Localización
- Es el proceso de adaptar software para una región
especifica o lenguaje añadiéndole componentes
específicos y traduciendo texto
8Localización
- Convenciones locales, la cultura y el lenguaje de
una región particular - El conjunto de letras que se utilizan para
escribir una lengua se dice escritura. - Cada localización solo tiene una escritura
9Beneficios
- Añadiendo la localización el mismo ejecutable
funciona en todo el mundo - Los elementos textuales, como los mensajes o las
etiquetas de los componentes no están en el
código, están fuera y se cogen dinámicamente - Las dependencias culturales como fechas, monedas,
aparecen en formatos que están acorde con la
localización
10Elementos
- Cultura
- Lengua hablada
- Colores
- Números
- Unidades de medida
- Monedas
- Escritura
11Elementos
- Iconos
- Texto
- Audio clips
- Ayuda en línea
- Formato de moneda, fechas y números
- Calendarios
- Medidas
- Colores
- Gráficos
- Números de teléfono
- Direcciones
- Títulos honoríficos
12Iconos
- Mullet y Sano (1995) señalan que la
comunicabilidad de cualquier representación
depende de que haya un contexto compartido entre
el que envía el mensaje y el que lo recibe que
permita que los signos sean interpretados dentro
de una lógica similar a la que fueron
codificados.
13ElementosCultura
- La cultura de una región o pais puede hacer
percibir un mismo objeto de dos maneras
diferentes en puntos geográficos diferentes - Ejemplos
- Tan pronto como sea posible es inmediatamente en
Estados Unidos y puede ser este mes en la cultura
latinoamericana - La mano izquierda es ofensiva en algunas culturas
14ElementosCultura
- Hay que cuidar como de dibujan hombres y mujeres
juntos y como van vestidos - Algunos simbolos com la esvastica, martillo y
hoz, sol naciente, cruces, estrellas representan
ideas politicas y relogiosas - En un pais islámico puede entenderse como
ofensivas cosas que en Occidente no tiene ningun
significado - Mover la cabeza, hacer adiós con la mano,
mujeroes en bikin, bebidas alcoholicas
15ElementosColores
- Tienen significado a través de la tradición en la
mayor parte de las culturas - Occidental
- Negro es un color asociado con la muerte y con
funerales - Blanco asociado con pureza
- Verde y azul frío y tranquilo
- Rojo, caliente y símbolo de riesgo, peligro
- Oriental
- Blanco asociado con la muerte
- Rojo casamiento
16ElementosColores
- Cada cultura tiene sus estándares, por lo que es
difícil generalizar - Semáforo
- Rojo (parar), ambar (precaución) i verde
(adelante), pero no tan solo estos los podemos
asmuir de una manera generalizada
17Elementos Calendarios, formato y separadores de
fecha y hora
- Hay otros tipos de calendario aparte Gregoriano
- Budista, el chino, hebreo, etc...
- Formato calendario gregoriano
- aa/mm/dd aa dos ultimos digitos del año
- aaddd mm mes
- aaaa/nn/dd dd dia
- dd/mm/aa aaaa año
- mm/dd/aa
18Elementos Formatos de números y monedas
- Para cada país hace falta tener en cuenta el
símbolo de la moneda y el formato numérico - USA 1,234,56
- Noruega kr1.234,56
- Suiza sFr1234,56
- Alemania 1.234,56DM
- Euro ?
19Ordenación
- Las ordenaciones son importantes en el proceso de
internacionalización y un tema complejo - En un principio las ordenaciones de caracteres
son de la A a la Z, mayúsculas primero y después
las minúsculas, los número de ordenan de 0 a 9 - Este tipo de regla no siempre es aceptable,
porque hay reglas más complicadas cuando hay que
considerar un segundo carácter al mismo tiempo
20Ordenación en castellano
- Mal
- caracola chacal cura danza llama luna
marmota -
- Bien
- caracola cura chacal danza luna llama
marmota
21Ordenación en castellano
- En castellano por ejemplo, ch es un doble
caracter, que se ha tratar como un solo caracter
y se ordena despues de la c y antes de la d. La
ll es un doble caracter que tambíen hay que
considerarlo como uno solo y se ordena despues de
la l y antes de la m
22Elementos específicosUnidades de medida
- La mayor parte del mundo utiliza el sistema
métrico excepto Estados Unidos - Utiliza la milla, la pulgada, etc..
23Zonas
24ElementosEscrituras
- Las escrituras se pueden clasificar en ideogramas
y escrituras fonéticas - Un ideograma tien un significado especial y no
tiene relación con su pronuciación - Las letras de una escritura fonética representan
determinados sonidos, como por ejemplo M - Los tres sistemas de escritura mas importantes
son - Occidentales
- Oriente medio
- Oriente lejano
25Escrituras Occidentales
- Las escrituras occidentales son Latín, griego y
cirílico - Las siguientes características son comunes a las
tres escrituras - Fonéticas
- Se leen de izquierda a derecha en una línea
horizontal - Utilizan letras mayúsculas y minúsculas
diferentes - Utilizan numeración aràbiga 0,1,2,3,4,5,6,7,8,9
26EscriturasExtremo Oriente
- Las escrituras del oriente lejano estan basados
en caracteres ideográficos chinos - Los caracteres chinos son únicos, por su sistema
especial de construcción, su larga história y su
pronunciación - Su antigüedad se remonta a 4000 años y se
utilizan de esta forma desde hace mas de 2000
años - Actualmente se utilizan unos cuantos miles de
caracteres
27EscriturasLejano oriente
28EscriturasEsquemas de codificación
- Cada tipo de escritura ha de ser representada en
sistemas informáticos - Esta representación se concreta en un esquema de
codificación - Estos esquemas se codifican a través de mapas de
caracteres
29ASCII
- El mapa de carácteres ASCII consta de 128
carácteres - Los caracteres en el rango de o a 31 y el
carácter 127 son especiales, tipicamente de
control - Cada carácter es un indice en el mapa de
caracteres, por ejemplo el número 65 es la letra
A y el 97 la letra a - El codigo ASCII de 128 caracters solo se
utilizaba para el inglés - En principio con 128 caracteres habia bastante
- Al necesitar nuevos idiomas se empezó a utilizar
el resto de 128 caracteres
30Tipos de esquemas de codificación
- Mapa de caracteres de un octeto (SBCS)
- Mapa de caracteres de doble octeto (DBCS)
- Unicode
31Mapa de caracteres de un solo octeto (SBCS)
- Son mapas de caracteres de hasta 256 caracteres
(256 28). - Es una extensión del código ASCII, al que se han
añadido 128 caracteres del 128 al 255 - Se denomina mapa de caracteres extendido
- ISO
- 8859-2 Latín europa del este
- 8859-5 Cirilico Europa del este
- 8859-1 Latin Europa Oeste
- 8859-7 Griego
- 8859-3 Turco
- 8859-8 Hebreo
- 8859-6 Arabe
32ISO 8859 - I Latin
33ASCII ISO 8879
34Mapa de caràcters de doble octeto (DBCS)
- Las escrituras del extremo oriente utilizan
caracteres ideográficos - Necesitan un mapa de caracteres mas grande de 256
caracteres - Para resolverlo se hizo el mapa de caracteres de
doble octeto - Notación de 16 bits
- 65536 (216) caràcters
- El DBCS de un solo octeto se corresponde con el
código ASCII - Algunos caracteres se definen como octetos de
comienzo y un segundo de código
35Codigo KANJI
36Codi KANJI
- El codigo Kanji definido por el JIS (Japan
Industry Standard JIS.). - El JIS nivel I contiene alrededor de 3000 de los
caracteres mas normales - El nivel 2 añade 3500 caracteres mas
- El tercer nivel se ha definido recientemente e
incrementa el mapa de caracteres en mas de 6000
caracteres - JIS está basado en un formato de 7 bits que
requieren secuencias de ESCAPE especiales para
entrar o salir del modo DBCS.
37Problemas
- Duplicidad en la codificación de caracteres
- Multiples códigos de caracteres incosistentes
debido al conflicto entre estándares nacionales y
de la indústria - El código ASCII de 7 bits o el de 8 bits, estan
limitados a 128 y 256 posiciones de código y son
inadecuados en un entorno global - Internet ha añadido un punto más a la demanda de
un conjunto de caracteres único en el mundo
38Unicode
- Unicode es una codificación de caracteres de 16
bits - Consensuado, participan
- Apple, Borland, Digital, Hewlett-Packard, IBM,
Lotus, Metaphor, Microsoft, Next, Novell,
Research Libraries Group, Sun, WordPerfect, i
Xerox - Se puede hacer un acceso aleatorio en los
caracteres - Los programas no tienen que guardar estados al
analizar cadenas - El codigo Unicode es único para un carácter
determinado
39Unicode
40Unicode
41UnicodeDisposición de símbolos i letras
42Un modelo de localización
Recursos localizados
Código de la aplicación
Producto localizado
43Guía técnica
- En esta parte de discuten problemas generales de
conversiones a diferentes versiones del lenguaje
y las diferentes necesidades que se preveen para
planificar la localización
44Desarrollo
- Activación en el momento de la ejecución o al
menos en el de la compilación
45Puntos a revisar
- Elementos específicos de la localización
- Convenciones en el procesamiento de texto que
incluye - ordenació, classificació de caràcters,
pronunciación, guionado, funciones de gestión de
cadenas e intercambio de ficheros (Importación y
exportación de ficheros) - Gestión de las entradas
- Gestión de les salidas
46Traducción del texto
- Todas las lenguas tienen gramática y sintaxis
diferentes - El texto traducido cambia de tamaño, hay que
prever que pueda crecer - Ejemplo
- Mover se traduce como verschieben en alemán
- 5 contra 11
47Organización de diálogos (Layout)
- La organización de controles y elementos en una
ventana ha de considerar la expansión de las
etiquetas de texto - En hebreo y árabe la información se escribe de
derecha a izquierda (Hace falta invertir la
presentación ) - Algunos idiomas incluyen marcas diacríticas que
requieren espació adicional - Permite un 30 de expansión
48Barra de estado
- La versión inglesa solo ha de ocupar el 50 de la
barra de estado
49Menús
- Evitar menús muy densos
- Límite 80 caractere
- Aceleradores coinciden con el primer carácter de
una palabra
50Desarrollo de codigo internacional
- Documentar todos los recursos que tienen que ser
localizados - Es útil hacer dos localizaciones en paralelo para
poder evaluar la i18n - Es importante dispones de herramientas y
utilidades para hacer la localización
51Bibliografìa (1)
- Apple Computer. Guide to Macintosh Software
Localization. (1992) - Fernandez Tony. Global Interface Design A Guide
to Designing International User Interfaces.
Boston A.P Professional (1995) - Galdo del. Eliza, Jakob Nielsen.International
User Interfaces. John Wiley Sons. (1996) - Kano Nadine, Microsoft Corporation.Developing
International Software for Windows 95 and Windows
NT. W.A Microsoft Press. (1995) - Martin O'Donnell Sandra. Programming for the
World A guide to Internationalization.
Prentice-Hall(1994)
52Bibliografía (2)
- Microsoft Press . The GUI Guide. International
Terminology for the Windows Interface.
Microsoft.(1993) - Uren Emmanuel, et al . Software
Internationalization and localization. Van
Nostrand Reinhold.(1993) - Addison and Wesley. The Unicode Standard
Worldwide Character Encoding - Volume I i II (ISBN 0-201-56788-1 and ISBN
0-201-60845-6). - Unicode Consortium . The Unicode Standard. (1991)
- Prespectives on Design and Internationalization.
SIGCHI Bulletin Vol 28. Enero 1996.
53Enlaces
- Internacionalització i Localització
- Internationalization (Tutorial)
- Internationalization FAQ
- Internationalization of User Interfaces.
- Windows Interface Guidelines
Internationalization - W3C Internationalization and Localization.
- Unicode Unicode Home Page
- Java Tools International classes for Unicode
- ASCII ASCII-ISO8859
- Java Java Internationalization.
54Conclusiones
- La globalización de la economia es una realidad
- Esta presentación pretende ser una puerta de
entrada a la internacionalización - La internacionalización de interfases es una
necesidad que hay que tener en cuenta al principio