Reconocimiento de caracteres en imágenes no estructuradas

El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presen...

Full description

Bibliographic Details
Main Author: Carranza Astrada, Rodrigo Pablo
Other Authors: Sánchez, Jorge Adrián, dir.
Format: bachelorThesis
Language:spa
Published: 2016
Subjects:
Online Access:http://hdl.handle.net/11086/2818
Description
Summary:El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presenta un análisis del impacto producido en la performance de clasificación al entrenar un clasificador de caracteres con imágenes sintéticas (Wang et al., 2011). Se complementa esto realizando una análisis de performance utilizando diferentes conjuntos de entrenamiento sintéticos generados a partir del dataset público conocido como Chars74k. El resultado final de este trabajo sirve para corrobar que este tipo de datos produce un impacto positivo en la clasificación y más aún al combinar estas con datos reales.