Aplicación de Modelos de Aprendizaje Automático para la Caracterización Hidrogeoquímica del Agua Subterránea en Boyacá, Colombia: Comparación de Modelos de Clasificación y Método Ensamblado Stacking
Author:
Publication date:
Serie:
Máster Universitario en Análisis de Datos para la Inteligencia de Negocios
Abstract:
El agua subterránea es un recurso fundamental para el consumo humano, la agricultura y diversas actividades industriales. Según el Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM), este recurso hídrico representa el 97% de las reservas de agua dulce en el planeta [1]. Esta investigación tiene como objetivo evaluar y comparar el rendimiento de distintos modelos de aprendizaje automático para la caracterización hidrogeoquímica del agua subterránea en Boyacá, Colombia. La pregunta central es: ¿Cuál es el rendimiento de diferentes modelos de aprendizaje automático en la clasificación hidrogeoquímica del agua subterránea según su fuente de captación (Aljibe, Manantial o Pozo)? Para responder a esta pregunta, se utilizaron datos obtenidos de la Plataforma de Datos Abiertos del Estado Colombiano, que incluye información detallada sobre diversos parámetros hidrogeoquímicos. Los datos fueron analizados y preprocesados para diseñar, evaluar y comparar el rendimiento de modelos de clasificación supervisada, incluyendo: Árboles de Decisión, Bosques Aleatorios, Naive Bayes, Redes Neuronales y Métodos de Ensamblado Stacking. Los resultados del estudio indican que los métodos de ensamblado, en particular el método Stacking, donde se combinan Bosques Aleatorios como modelo base y Naive Bayes como metamodelo, superan a los modelos individuales en términos de exactitud y capacidad discriminativa para clasificar los tipos de captación de agua subterránea. Específicamente, el modelo ensamblado Stacking alcanzó una exactitud del 87.5%, comparado con los modelos: Bosques Aleatorios (82.08%), Redes Neuronales (80.6%), Árbol de Decisión (72.64%) y Naive Bayes (70.75%).
El agua subterránea es un recurso fundamental para el consumo humano, la agricultura y diversas actividades industriales. Según el Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM), este recurso hídrico representa el 97% de las reservas de agua dulce en el planeta [1]. Esta investigación tiene como objetivo evaluar y comparar el rendimiento de distintos modelos de aprendizaje automático para la caracterización hidrogeoquímica del agua subterránea en Boyacá, Colombia. La pregunta central es: ¿Cuál es el rendimiento de diferentes modelos de aprendizaje automático en la clasificación hidrogeoquímica del agua subterránea según su fuente de captación (Aljibe, Manantial o Pozo)? Para responder a esta pregunta, se utilizaron datos obtenidos de la Plataforma de Datos Abiertos del Estado Colombiano, que incluye información detallada sobre diversos parámetros hidrogeoquímicos. Los datos fueron analizados y preprocesados para diseñar, evaluar y comparar el rendimiento de modelos de clasificación supervisada, incluyendo: Árboles de Decisión, Bosques Aleatorios, Naive Bayes, Redes Neuronales y Métodos de Ensamblado Stacking. Los resultados del estudio indican que los métodos de ensamblado, en particular el método Stacking, donde se combinan Bosques Aleatorios como modelo base y Naive Bayes como metamodelo, superan a los modelos individuales en términos de exactitud y capacidad discriminativa para clasificar los tipos de captación de agua subterránea. Específicamente, el modelo ensamblado Stacking alcanzó una exactitud del 87.5%, comparado con los modelos: Bosques Aleatorios (82.08%), Redes Neuronales (80.6%), Árbol de Decisión (72.64%) y Naive Bayes (70.75%).
Collections
- Trabajos Fin de Máster [5228]