Representaciones de vocabularios en tareas de traducción automática mediante modelos conexionistas

Author

Casañ Núñez, Gustavo Adolfo

Director

Martínez Sotoca, José

Date of defense

2011-05-06

ISBN

978-84-694-4734-5

Pages

246 p.



Department/Institute

Universitat Jaume I. Departament de Llenguatges i Sistemes Informàtics

Abstract

Trabajos anteriores de traducción automática con modelos conexionistas han obtenido resultados interesantes pero han resultado muy problemáticos de adaptar a tareas reales. En este trabajo se parte del modelo RECONTRA (una red de Elman con ventana de entrada) y se abordan tareas de traducción más complejas, se explora cómo crear codificaciones automáticamente, se desarrollan nuevos modelos de traducción y se combinan distintas redes en un único sistema. Se han desarrollado varios modelos conexionista basados en Perceptrones Multicapa con ventanas de salida, por lo que tiene en cuenta el contexto de aparición de las palabras a representar. Además de diversos métodos de entrenamiento, se aplica poda para determinar el tamaño de las codificaciones. Se han creado variantes del modelo RECONTRA: con dos capas, en el que la primera capa oculta desarrolla representaciones de las palabras de la entrada; y con ventana de salida, en las que el traductor debe traducir un fragmento de la frase, no una única palabra. También se han explorado formas de combinar redes en único sistema de traducción, basándose en votación y la distancia entre la palabra producida por la red (o frase) y la palabra (o frase) más cercana.

Keywords

traducción automática; redes neuronales artificiales; creación automática de codificaciones

Subjects

004 - Computer science and technology. Computing. Data processing; 81 - Linguistics and languages

Documents

casany.pdf

1.748Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)