Mi DSpace
Usuario
Contraseña
Please use this identifier to cite or link to this item: http://hdl.handle.net/20.500.12590/16403
Title: Análisis layout de documentos históricos basado en operadores morfológicos y componentes conectados
Authors: Alarcon Arenas, Sebastian Wilde
metadata.dc.contributor.advisor: Meza Lovon, Graciela Lecireth
Keywords: Análisis layout;Componentes conectados;Operadores morfológicos;Documentos históricos
Issue Date: 2020
Publisher: Universidad Católica San Pablo
Abstract: Durante las últimas décadas, el interés en preservar documentos históricos digitales ha ganado considerable atención. Para aprovechar todas las ventajas y oportunidades que ofrecen los documentos digitalizados, es necesario comprender su contenido. El primer paso hacia esa comprensión es determinar los elementos de dicho documento, como figuras, títulos y subtítulos, texto, etc. Esta tesis presenta un nuevo enfoque híbrido para analizar la estructura de los documentos que se basa en operadores morfológicos y componentes conectados. El método propuesto se divide en dos etapas, preprocesamiento, en las que se mejora la calidad de las imágenes del documento; y análisis de layout, en el que identificamos tres tipos de layouts: títulos, párrafos gráficos. Este proceso también incluye un proceso de fragmentación, en el que dividimos la imagen de la página en secciones de manera que mejora la identificación de elementos del documento histórico. Finalmente, se realiza los experimentos en un conjunto de datos que contiene periódicos históricos antiguos, comparándolo con las técnicas base utilizadas para la implementación de esta propuesta.
URI: http://repositorio.ucsp.edu.pe/handle/20.500.12590/16403
Appears in Collections:Tesis Pregrado - Ciencia de la computación

Files in This Item:
File Description SizeFormat 
ALARCON_ARENAS_SEB_LAY.pdf8.08 MBAdobe PDFView/Open    Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.