Mi DSpace
Usuario
Contraseña
Please use this identifier to cite or link to this item: http://hdl.handle.net/20.500.12590/16647
Title: Estimación de la incertidumbre en redes neuronales profundas
Authors: Jaita Aguilar, Jose Hugo
metadata.dc.contributor.advisor: Mora Colque, Rensso Victor Hugo
Keywords: Incertidumbre;Inferencia variacional;Redes neuronales profundas
Issue Date: 2020
Publisher: Universidad Católica San Pablo
Abstract: Hoy en día, los modelos de aprendizaje profundo representan el estado del arte en muchas tareas, lo que ha motivado a utilizarse en distintas aplicaciones reales. Varias de ellas se encuentran en campos como: la medicina, seguridad, finanzas, etc. en donde una predicción errónea puede llegar a ser fatal. Por lo tanto, necesitamos que los modelos no solo den una predicción, sino que además un grado de certeza acerca de ella, es decir, la incertidumbre en la predicción. En esta tesis se estudian dos tipos de incertidumbre: la epistémica (la cual captura la falta de certeza del modelo) y la aleatoria (generada por el ruido en los datos). La estimación de la incertidumbre epistémica es un desafío, siendo el enfoque bayesiano el más utilizado para abordarla (debido a las herramientas que nos ofrece), pero este viene con un costo computacional prohibitivo, evidenciado aún más en modelos de aprendizaje profundo. Nosotros proponemos el método SVGD-A, utilizando como base al método SVGD, para realizar la inferencia bayesiana. Nuestra propuesta se enfoca en acelerar el proceso de convergencia de SVGD, permitiendo el escalamiento a modelos profundos. En cuanto a la incertidumbre aleatoria, nosotros proponemos un método basado en la extracción de características de bajo nivel en modelos ya entrenados, para luego aplicarles (a las características) una reducción de dimensionalidad con t-SNE, volviendo as ́ı el problema en una tarea de cauterización. Además, proponemos un segundo método el cual utiliza el mismo esquema descrito anteriormente, pero con la novedad que se le agrega un Autoencoder Variacional. Y por último, aportamos con un novedoso enfoque para realizar inferencia usando t-SNE. Finalmente, mostramos la eficiencia de nuestros métodos en la tarea de detectar muestras out-of-distribution en distintas bases de datos, logrando resultados muy superiores al estado del arte.
URI: http://hdl.handle.net/20.500.12590/16647
Appears in Collections:Tesis Postgrado - Maestría en Ciencia de la Computación

Files in This Item:
File Description SizeFormat 
JAITA_AGUILAR_JOS_EST.pdf7.31 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.