Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining

A medida que la cantidad de información disponible en la web aumenta, también lo hace la tarea de localizarla y analizarla, por lo cual realizar esta tarea de forma manual puede ser costosa en función al tiempo y esfuerzo invertido. Aunque los buscadores y los motores de bases de datos pueden ayudar...

Full description

Bibliographic Details
Main Author: Aguilar, Luis Humberto
Format: info:eu-repo/semantics/article
Language:spa
Published: Universidad Nacional de Córdoba. Facultad de Filosofía y Humanidades. Museo de Antropología 2023
Subjects:
Online Access:http://hdl.handle.net/11336/226918
https://suquia.ffyh.unc.edu.ar/handle/suquia/174985
_version_ 1826515362627190784
author Aguilar, Luis Humberto
author_facet Aguilar, Luis Humberto
author_sort Aguilar, Luis Humberto
collection Repositorio Suquia
description A medida que la cantidad de información disponible en la web aumenta, también lo hace la tarea de localizarla y analizarla, por lo cual realizar esta tarea de forma manual puede ser costosa en función al tiempo y esfuerzo invertido. Aunque los buscadores y los motores de bases de datos pueden ayudar a encontrar la información requerida, en infraestructuras digitales grandes donde los resultados de búsqueda se cuentan por millares – o más– se precisan de nuevas herramientas para obtener el contenido buscado de manera efectiva. Este trabajo propone la aplicación de Web Scraping y Text Mining como insumos metodológicos para poder compilar y procesar grandes volúmenes de datos en infraestructuras digitales de una forma más automatizada. La automatización de ambos procesos aporta una gran ventaja al analizar corpus textuales de miles de registros lo cual simplifica de manera significativa la obtención de diferentes tipos de datos, facilitando el trabajo considerablemente. Se espera que esta contribución permita ampliar las posibilidades de la comunidad arqueológica en clave de una metodología novedosa para la obtención y el manejo de datos estructurados y no estructurados que pueden ser integrados a las investigaciones de la comunidad arqueológica en general.
format info:eu-repo/semantics/article
id suquia-ffyh.174985
institution Universidad Nacional de Cordoba
language spa
publishDate 2023
publisher Universidad Nacional de Córdoba. Facultad de Filosofía y Humanidades. Museo de Antropología
record_format dspace
spelling suquia-ffyh.1749852024-08-02T01:21:42Z Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining Scraping Archaeology: A Methodological Approach from the Web Scraping and Text Mining Aguilar, Luis Humberto Web scraping Arqueología digital Análisis de datos Text mining https://purl.org/becyt/ford/6.1 https://purl.org/becyt/ford/6 A medida que la cantidad de información disponible en la web aumenta, también lo hace la tarea de localizarla y analizarla, por lo cual realizar esta tarea de forma manual puede ser costosa en función al tiempo y esfuerzo invertido. Aunque los buscadores y los motores de bases de datos pueden ayudar a encontrar la información requerida, en infraestructuras digitales grandes donde los resultados de búsqueda se cuentan por millares – o más– se precisan de nuevas herramientas para obtener el contenido buscado de manera efectiva. Este trabajo propone la aplicación de Web Scraping y Text Mining como insumos metodológicos para poder compilar y procesar grandes volúmenes de datos en infraestructuras digitales de una forma más automatizada. La automatización de ambos procesos aporta una gran ventaja al analizar corpus textuales de miles de registros lo cual simplifica de manera significativa la obtención de diferentes tipos de datos, facilitando el trabajo considerablemente. Se espera que esta contribución permita ampliar las posibilidades de la comunidad arqueológica en clave de una metodología novedosa para la obtención y el manejo de datos estructurados y no estructurados que pueden ser integrados a las investigaciones de la comunidad arqueológica en general. As the amount of information available on the web increases, so does the task of locating and analysing it, and performing this task manually can be costly in terms of time and effort. Although search engines and database engines can help to find the required information, in large digital infrastructures where search results are in the thousands - or more - new tools are needed to effectively retrieve the searched content. This paper proposes the application of Web Scraping and Text Mining as methodological inputs to be able to compile and process large volumes of data in digital infrastructures in a more automated way. The automation of both processes provides a great advantage in analysing textual corpora of thousands of records, which significantly simplifies the collection of different types of data, facilitating the work considerably. It is hoped that this contribution will expand the possibilities of the archaeological community in terms of a novel methodology for the collection and handling of structured and unstructured data that can be integrated into the research of the wider archaeological community. Fil: Aguilar, Luis Humberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Córdoba. Instituto de Antropología de Córdoba. Universidad Nacional de Córdoba. Facultad de Filosofía y Humanidades. Instituto de Antropología de Córdoba; Argentina. Universidad Nacional de Córdoba. Facultad de Filosofía y Humanidades. Museo de Antropología; Argentina 2023-12 2024-08-02T01:21:42Z 2024-08-02T01:21:42Z info:eu-repo/semantics/article info:ar-repo/semantics/artículo info:eu-repo/semantics/publishedVersion http://hdl.handle.net/11336/226918 Aguilar, Luis Humberto; Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining; Universidad Nacional de Córdoba. Facultad de Filosofía y Humanidades. Museo de Antropología; Revista del Museo de Antropología; 16; 3; 12-2023; 439-450 1852-060X 1852-4826 CONICET Digital CONICET https://suquia.ffyh.unc.edu.ar/handle/suquia/174985 spa info:eu-repo/semantics/altIdentifier/url/https://revistas.unc.edu.ar/index.php/antropologia/article/view/41094 info:eu-repo/semantics/altIdentifier/doi/10.31048/1852.4826.v16.n2.41094 info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ application/pdf application/pdf Universidad Nacional de Córdoba. Facultad de Filosofía y Humanidades. Museo de Antropología
spellingShingle Web scraping
Arqueología digital
Análisis de datos
Text mining
https://purl.org/becyt/ford/6.1
https://purl.org/becyt/ford/6
Aguilar, Luis Humberto
Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining
title Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining
title_full Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining
title_fullStr Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining
title_full_unstemmed Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining
title_short Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining
title_sort raspando la arqueologia una aproximacion metodologica desde el web scraping y text mining
topic Web scraping
Arqueología digital
Análisis de datos
Text mining
https://purl.org/becyt/ford/6.1
https://purl.org/becyt/ford/6
url http://hdl.handle.net/11336/226918
https://suquia.ffyh.unc.edu.ar/handle/suquia/174985
work_keys_str_mv AT aguilarluishumberto raspandolaarqueologiaunaaproximacionmetodologicadesdeelwebscrapingytextmining
AT aguilarluishumberto scrapingarchaeologyamethodologicalapproachfromthewebscrapingandtextmining