Descripción:
La sequía presenta un problema a nivel global, debido a su creciente aparición y severidad en distintas partes del planeta, el estado de Hidalgo tuvo recientemente la mayor crisis sobre este problema en 10 años. Por lo cual, la oportuna y eficaz identificación de este fenómeno es fundamental para mitigar sus consecuencias con medidas congruentes y acertadas.
El objetivo de esta investigación fue poder aplicar distintas técnicas de minería de datos con métodos de agrupamiento no supervisados, pobre imágenes multiespectrales para identificar y analizar patrones de sequía, así como evaluar la eficiencia de cada algoritmo sobre este problema. Con la finalidad de identificar si estos algoritmos pueden ser una herramienta para los expertos y así disminuir el margen de error humano que estos puedan tener.
Se siguió la metodología KDD (Knowledge Discovery in Databases) para el desarrollo de la investigación, obteniendo las imágenes multiespectrales mediante el programa Landsat 8 y 9 de la región de Hidalgo durante 4 periodos con niveles de sequía distintos. Estas fueron preprocesadas y transformadas con la finalidad de obtener una base consistente e integra. Posteriormente se aplicaron los algoritmos de agrupamiento, K Means, Jerárquico y DBScan para segmentar las zonas afectadas. Se realizó una evaluación basada en índices de validación a cada uno de los grupos y algoritmos, identificando el mejor resultado y recreando las imágenes basadas en las agrupaciones obtenidas por el mejor algoritmo.
La investigación arrojo una ligera ventaja de K Means sobre el método Jerárquico y una deficiencia de DBScan para la identificación de la sequía, puesto que la configuración de los parámetros y el coste computacional impidieron obtener resultados útiles para la investigación por parte de este algoritmo. La reconstrucción de las imágenes demostró una agrupación sensible a la severidad de la sequía, aunque hay que tomar en cuenta que, la forma de identificar sequía y asignar un clúster fue distinta dependiendo la fecha y el nivel de sequía que contenía la imagen multiespectral.
Se concluye que el uso de algoritmos de minería de datos en la identificación de la sequía es una herramienta bastante útil que puede permitir a los expertos minimizar el margen de error y algunas ambigüedades generadas por el ser humano. Además, se demostró que K Means tuvo un mejor desempeño sobre del método Jerárquico y DBScan para la identificación de la sequía en el Estado de Hidalgo siendo una herramienta útil en esta tarea.