Modelo de arquitectura para la ingestión, procesamiento y análisis de datos a gran escala

Abstract
Esta tesis investiga el campo del big data, explorando soluciones para su gestión y aprovechamiento óptimo. En un mundo donde la acumulación de datos es imparable, las empresas encuentran oportunidades invaluables. Herramientas como Hadoop y Elasticsearch, diseñadas para superar los desafíos del procesamiento convencional, permiten la eficaz manipulación de vastos volúmenes de datos distribuidos. Esta investigación también ofrece un panorama completo de las herramientas disponibles para construir soluciones integrales. El núcleo de esta tesis reside en la exploración profunda de los fundamentos de los Data Lakes y su integración en la gestión del big data. Se desglosan arquitecturas esenciales y se examinan tecnologías clave que posibilitan la construcción de entornos de almacenamiento y procesamiento de datos altamente adaptables. Un caso de estudio concreto en la industria petrolera de Texas sirve de ejemplo ilustrativo. Se detalla la recolección y análisis de datos relevantes provenientes de diversas fuentes, como la Energy Information Administration y el Servicio Geológico de Estados Unidos. Este estudio demuestra cómo las herramientas de procesamiento de big data y la implementación de Data Lakes pueden generar valor y simplificar la toma de decisiones estratégicas en un sector industrial altamente competitivo. En resumen, esta tesis aborda el universo del big data, enfocándose en cómo los Data Lakes se han convertido en una solución esencial para gestionar la avalancha de información en nuestros días. Con un enfoque particular en la industria petrolera de Texas, esta investigación explora cómo estas tecnologías innovadoras pueden revolucionar el tratamiento de datos, facilitando análisis profundos y decisiones fundamentadas.
Description
Keywords
Lago de datos, Arquitectura lagos de datos, Datos a gran escala, Procesamiento de datos
Citation