Please use this identifier to cite or link to this item:
http://hdl.handle.net/UCSP/15404
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Ochoa Luna, José Eduardo | - |
dc.contributor.author | Copara Zea, Jenny Linet | - |
dc.date.accessioned | 2017-08-10T17:27:09Z | - |
dc.date.available | 2017-08-10T17:27:09Z | - |
dc.date.issued | 2017 | - |
dc.identifier.other | 1055563 | - |
dc.identifier.uri | http://repositorio.ucsp.edu.pe/handle/UCSP/15404 | - |
dc.description.abstract | El reconocimiento de entidades nombradas es una tarea relevante en el a´rea de Procesamiento de Lenguaje Natural, su funci´on es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma ingl´es. Recientes estudios en el idioma ingl´es han mostrado que utilizar caracter´ısticas no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si caracter´ısticas no supervisadas pueden mejorar la tarea de NER supervisado en el idioma espan˜ol. Para esto, se propone utilizar caracter´ısticas no supervisadas mediante word representations y colocaciones, as´ı como caracter´ısticas adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utiliza cross-lingual word representations, es comparable a abordajes de aprendizaje profundo, actualmente el estado del arte para NER en espan˜ol. | es_PE |
dc.description.uri | Tesis | es_PE |
dc.format | application/pdf | es_PE |
dc.language.iso | spa | es_PE |
dc.publisher | Universidad Católica San Pablo | es_PE |
dc.rights | info:eu-repo/semantics/openAccess | es_PE |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | es_PE |
dc.source | Universidad Católica San Pablo | es_PE |
dc.source | Repositorio Institucional - UCSP | es_PE |
dc.subject | Procesamiento de lenguaje natural | es_PE |
dc.subject | NER para español | es_PE |
dc.subject | Conditional Random Fields | es_PE |
dc.subject | Word embeddings | es_PE |
dc.title | Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas | es_PE |
dc.type | info:eu-repo/semantics/masterThesis | es_PE |
thesis.degree.name | Maestro en Ciencia de la Computación | es_PE |
thesis.degree.grantor | Universidad Católica San Pablo. Facultad de Ingeniería y Computación | es_PE |
thesis.degree.level | Maestría | es_PE |
thesis.degree.discipline | Ciencia de la Computación | es_PE |
thesis.degree.program | Escuela Profesional de Ciencia de la Computación | es_PE |
Appears in Collections: | Tesis Postgrado - Maestría en Ciencia de la Computación |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
COPARA_ZEA_JEN_REC.pdf | 777.73 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.