Abstract

Recientemente, los sistemas de traducción basados en redes neuronales están empezando a competir con los sistemas basados en frases. Los sistemas que se basan en las redes neuronales usan representaciones vectoriales de las palabras. Sin embargo, uno de los mayores retos que aún enfrenta la Traducción Automática (TA), se trata de grandes vocabularios y lenguas morfológicamente ricas. Este trabajo tiene como objetivo adaptar un sistema de TA neuronal para traducir del chino al español, utilizando como entrada diferentes tipos de granularidad: palabras, caracteres, fuentes de mapa de bits de las palabras chinas y las fuentes de mapa de bits de caracteres chinos. El esquema sugerido para el modelo TA neuronal mitiga el problema de las palabras de origen desconocido. El hecho de realizar la interpretación de cada carácter o palabra como una fuente de mapa de bits permite obtener representaciones vectoriales más informadas. Los mejores resultados se obtienen cuando se utiliza la información de la fuente palabras del mapa de bits.

Links and resources

Tags