Datos, datos y más datos
Brain-IoT

Machine Learning para predecir el desagüe de una presa

19/07/2019
Machine learning para medir los niveles de una presa

¿Cómo predecir cuánto abrir las compuertas de una presa para dar un servicio óptimo?

Descubre nuestro trabajo en el proyecto europeo Brain-IoT: desarrollamos comportamientos inteligentes con características avanzadas de aprendizaje automático, para decidir cuánto desaguar diariamente la presa de Cecebre.

Puedes leer el texto original en inglés, en la página oficial de Brain-IoT. 

 

Aprendizaje automático (ML) para la gestión de infraestructuras críticas

En BRAIN-IoT, la infraestructura de gestión del agua de EMALCSA de A Coruña se utiliza como un conjunto de casos de uso que demuestran cómo la plataforma y las herramientas desarrolladas en el marco del proyecto se pueden utilizar para resolver escenarios del mundo real.

Uno de estos casos de uso tiene que ver con el funcionamiento de las compuertas de la presa de Cecebre. Cada día se debe tomar una decisión con respecto a cuánto se abrirán las compuertas para proporcionar un nivel óptimo de flujo de agua al río. Esta decisión se basa principalmente (pero no solo) en: la precipitación del agua (últimos días y pronóstico), el nivel actual de volumen de agua en la presa y los valores de días anteriores.

 

Machine Learning para predecir el desagüe de una presa

Presa de Cecebre, A Coruña, EMALCSA

Este caso de uso fue elegido como un gran ejemplo para desarrollar un comportamiento inteligente (Smart Behaviour) con características avanzadas de aprendizaje automático. EMALCSA nos proporciona acceso a datos reales de sensores actualmente gestionados en su plataforma SICA, que gestiona de forma integrada varias instalaciones de EMALCSA, como la presa de Cecebre, la ETAP de A Telva, la "Casa del Agua" y también las estaciones de bombeo y los depósitos de regulación de la red de distribución.

Además, para el desarrollo de este caso de uso disponemos de datos históricos de calidad con las medidas diarias de los parámetros mencionados anteriormente, durante los últimos 40 años.

Las técnicas de Machine Learning (ML) operan de manera muy diferente a los algoritmos clásicos de Inteligencia Artificial (AI), conocidos como AI Simbólico. En la programación clásica, los expertos diseñan, modelan y desarrollan un conjunto de reglas que producen un resultado "inteligente". En ML, los datos disponibles, así como los resultados esperados para esa información (predicción), se incorporan a un “modelo” de ML que se adapta, aprende y se comporta de forma equivalente a un conjunto de reglas: pero es preciso subrayar que en ML este sistema es entrenado y su comportamiento podría llevar a resultados imprevisibles que deben ser evaluados.

Hasta ahora, desde Improving Metrics, hemos seleccionado dos métodos de ML diferentes para demostrar los resultados del proyecto en el caso de uso de infraestructura crítica de EMALCSA: Redes Neuronales Recurrentes (RNN) y Modelo Autorregresivo Integrado de Media Móvil (ARIMA en inglés). Hemos desarrollado un comportamiento inteligente denominado Control de Flujo de Agua y se está utilizando para verificar estos modelos.

Somos uno de los socios del consorcio BRAIN-IoT y estamos a cargo del desarrollo de algoritmos de aprendizaje automático basados en los dos casos de uso mencionados. El feedback resultante se utiliza para enriquecer de forma iterativa las herramientas de arquitectura y modelado desarrolladas para BRAIN-IoT, de forma que éstas den soporte a un amplio subconjunto de tecnologías AI/ML clásicas y de vanguardia que utilizan el mismo conjunto de abstracciones. Esto, combinado con el enfoque basado en modelos y funcionalidades de seguridad, crea los comportamientos inteligentes que son fundamentales para el enfoque BRAIN-IoT.

 

Descripción general de los modelos de aprendizaje de ML seleccionados para desarrollar el comportamiento inteligente del flujo de salida de agua:

  • Las Redes Neuronales Recurrentes (RNN), una moderna técnica de Aprendizaje Profundo o Deep Learning que funciona muy bien para predicciones en series temporales y que necesita una gran cantidad de datos de entrenamiento. No es sorprendente que una arquitectura RNN conocida como memoria a largo plazo (LSTM) nos haya brindado los mejores resultados, midiendo las diferencias entre las predicciones y los valores esperados utilizando la raíz cuadrada media-error (RMSE).
  • Modelo Autorregresivo Integrado de Media Móvil (ARIMA), un método de análisis estadístico que funciona bien para datos de series temporales con tendencia y estacionalidad. Las predicciones resultantes del modelo ARIMA son razonablemente válidas, no tan buenas como RNN. Pero ARIMA puede calcular estas predicciones con solo unos pocos cientos de muestras, mientras que los modelos RNN necesitan, al menos, miles.

 

Cómo usar machine learning en infraestructuras críticas

Evolución a lo largo de 35 años de las 3 variables principales en el conjunto de datos: nivel de precipitación, palanca de agua y flujo de agua

 

Esta breve comparación subraya uno de los problemas típicos del uso general de los métodos avanzados de Deep Learning: la necesidad de conjuntos de datos de gran cantidad y calidad para entrenar los modelos. Además de eso, la fase de entrenamiento tiende a ser computacionalmente costosa: la gran capacidad de RNN para aprender patrones en conjuntos ordenados de datos tiene un costo. Esto presenta dificultades para poner los modelos en un entorno de producción y desarrollar las herramientas, aspecto que será explorado y desarrollado en la segunda etapa del proyecto BRAIN-IoT.

 

Autor:

Víctor Sóñora Pombo, Software Developer en Improving Metrics

Helena Martínez de Aspe
Communications Manager de Improving Metrics
Siguiente Anterior
Esta web emplea cookies. Si continúas navegando entendemos que aceptas nuestra Política de cookies.