Aprendizaje multimodal aplicado al etiquetado de imágenes

Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.

Bibliographic Details
Main Author: Peretti, Nicolás Jesús
Other Authors: Luque, Franco Martín
Format: publishedVersion
Language:spa
Published: 2021
Subjects:
Online Access:http://hdl.handle.net/11086/19982
_version_ 1801212091545157632
author Peretti, Nicolás Jesús
author2 Luque, Franco Martín
author_facet Luque, Franco Martín
Peretti, Nicolás Jesús
author_sort Peretti, Nicolás Jesús
collection Repositorio Digital Universitario
description Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
format publishedVersion
id rdu-unc.19982
institution Universidad Nacional de Cordoba
language spa
publishDate 2021
record_format dspace
spelling rdu-unc.199822022-10-13T11:31:39Z Aprendizaje multimodal aplicado al etiquetado de imágenes Peretti, Nicolás Jesús Luque, Franco Martín Sánchez, Jorge Adrián Visión por computadoras Aprendizaje automático Etiquetado de imágenes Aprendizaje multimodal PLN Computing methodologies Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019. publishedVersion Fil: Peretti, Nicolás Jesús. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. El aprendizaje multimodal estudia problemas de aprendizaje automático utilizando datos que combinan información de diferente naturaleza. Un ejemplo de tarea multimodal es el etiquetado de imágenes, donde una imagen debe ser etiquetada con términos (palabras) que describan el contenido de la imagen. En este trabajo proponemos estudiar modelos que permiten etiquetar imágenes a través de funciones que den una ordenación (ranking) de etiquetas posibles a cada imagen dada. Este ranking se obtiene a partir de una puntuación (score) que se obtiene de una función bilineal que combina representaciones de imágenes con representaciones de etiquetas textuales. Multimodal Learning is a subset of machine learning problems that work with data of different nature. An example of a multimodal task is image tagging where an image must be tagged with different representative tags that describe the image. In this work we will study different models that allow us to tag an image through functions that give a rank to image tags. In order to get this ranking we will use a bilinear function that combine image and tag embeddings. publishedVersion Fil: Peretti, Nicolás Jesús. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. 2021-08-27T22:26:22Z 2021-08-27T22:26:22Z 2019 bachelorThesis http://hdl.handle.net/11086/19982 spa Atribución-CompartirIgual 4.0 Internacional http://creativecommons.org/licenses/by-sa/4.0/
spellingShingle Visión por computadoras
Aprendizaje automático
Etiquetado de imágenes
Aprendizaje multimodal
PLN
Computing methodologies
Peretti, Nicolás Jesús
Aprendizaje multimodal aplicado al etiquetado de imágenes
title Aprendizaje multimodal aplicado al etiquetado de imágenes
title_full Aprendizaje multimodal aplicado al etiquetado de imágenes
title_fullStr Aprendizaje multimodal aplicado al etiquetado de imágenes
title_full_unstemmed Aprendizaje multimodal aplicado al etiquetado de imágenes
title_short Aprendizaje multimodal aplicado al etiquetado de imágenes
title_sort aprendizaje multimodal aplicado al etiquetado de imagenes
topic Visión por computadoras
Aprendizaje automático
Etiquetado de imágenes
Aprendizaje multimodal
PLN
Computing methodologies
url http://hdl.handle.net/11086/19982
work_keys_str_mv AT perettinicolasjesus aprendizajemultimodalaplicadoaletiquetadodeimagenes