Mi DSpace
Usuario
Contraseña
Please use this identifier to cite or link to this item: http://hdl.handle.net/UCSP/15404
Title: Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas
Authors: Copara Zea, Jenny Linet
metadata.dc.contributor.advisor: Ochoa Luna, José Eduardo
Keywords: Procesamiento de lenguaje natural;NER para español;Conditional Random Fields;Word embeddings
Issue Date: 2017
Publisher: Universidad Católica San Pablo
Abstract: El reconocimiento de entidades nombradas es una tarea relevante en el a´rea de Procesamiento de Lenguaje Natural, su funci´on es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma ingl´es. Recientes estudios en el idioma ingl´es han mostrado que utilizar caracter´ısticas no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si caracter´ısticas no supervisadas pueden mejorar la tarea de NER supervisado en el idioma espan˜ol. Para esto, se propone utilizar caracter´ısticas no supervisadas mediante word representations y colocaciones, as´ı como caracter´ısticas adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utiliza cross-lingual word representations, es comparable a abordajes de aprendizaje profundo, actualmente el estado del arte para NER en espan˜ol.
URI: http://repositorio.ucsp.edu.pe/handle/UCSP/15404
Appears in Collections:Tesis Postgrado - Maestría en Ciencia de la Computación

Files in This Item:
File Description SizeFormat 
COPARA_ZEA_JEN_REC.pdf777.73 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.