Diseño e implementación de redes neuronales recurrentes para la traducción automática

dc.contributor.advisorRamos Pollan, Raul
dc.contributor.authorPerez Becerra, Andres Alberto
dc.date.accessioned2024-03-03T23:19:55Z
dc.date.available2017
dc.date.available2024-03-03T23:19:55Z
dc.date.created2017
dc.date.issued2017
dc.description.abstractLa traducción automática neuronal es un enfoque reciente en la traducción automática. El traductor pertenece a la familia del codificador-decodificador encontrado en varios artículos. Este campo aún tiene espacio para mejoras pero ha sido estudiado solo en los siguientes idiomas: inglés, francés y alemán. En este proyecto se aplican las redes neuronales recurrentes para la traducción automática del español al inglés usando dos modelos, uno con 1000 unidades escondidas GRU (arquitectura 1) en cada RNN y otra usando 500 unidades escondidas GRU (arquitectura 2). Igualmente se usan dos dataset de entrenamiento, uno con 54M de palabras y otro con 28M de palabras y un dataset de prueba que consta de alrededor de 5M de palabras. Se obtuvieron resultados favorables usando el dataset de 54M con la arquitectura 1 obteniendo un puntaje BLEU de 27.60 comparado al estado del arte de 28.45, la diferencia es que el estado del arte usa un dataset 6 veces mayor al de este proyecto. Igualmente la arquitectura 2 con el dataset de 54M de palabras demostró ser efectiva al obtener 24.74 puntos sin haber tenido el mismo número de iteraciones o tiempo de computo de las otros modelos. Ha de resaltarse la capacidad de traducir por los modelos se basa en el uso de textos afines con los usados en el entrenamiento, ya que mantiene un orden sintáctico incluso cuando existen palabras desconocidas en la frase.
dc.description.abstractenglishThe neural machine translation is a recent approach in machine translation. The translator belongs to the coder-decoder family found in many articles. This field still show room for advances, but only has been studied in the following languages: English, French and German. In this project the recurrent neural network are used for the machine translation form Spanish to English using two models, one with 1000 GRU hidden units (architecture 1) and the other with 500 GRU hidden units (architecture 2). Here two training dataset are used, one with 54M of words and the other with 28M of words, and a test dataset of 5M of words. We got good results using the 54M dataset with the architecture 1 getting a BLEU score of 27.60, very similar to the state of the art score 28.45, the difference with the state of the art is that they use a dataset 6 times bigger than the used in this project. The architecture 2 with the 54M dataset showed a good performance getting 24.74 BLEU points without the same iteration number or time computed as of the other models. It has to be said that the capacity to translate by the models is based in the use of related texts to those used in the training, in this way the translated sentence will keep a syntactic order even .
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/36332
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectRedes Neuronales Recurrentes (Rnn)
dc.subjectTraducción Automática Neuronal (Nmt)
dc.subject.keywordRecurrent Neuronal Networks (Rnn)
dc.subject.keywordNeural Machine Translation (Nmt)
dc.titleDiseño e implementación de redes neuronales recurrentes para la traducción automática
dc.title.englishDesign and implementation of recurrent nerual networks for machine translation.
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
361.19 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
1.82 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
348.72 KB
Format:
Adobe Portable Document Format