Dinámica y navegación autónoma a través de cultivos de palma para dron hexarrotor basada en aprendizaje por refuerzo

Abstract
Este trabajo detalla la metodología utilizada para desarrollar un sistema de navegación autónoma para un dron hexarrotor, diseñado para operar en plantaciones simuladas de palma de aceite. La primera fase del proyecto consistió en la creación de un modelo dinámico no lineal, utilizando la dinámica de Lagrange que incluye fuerzas de vientos externos y efectos giroscópicos. Matlab fue empleado para realizar operaciones simbólicas permitiendo de esta forma la obtención eficiente de las ecuaciones de movimiento del dron. El sistema de navegación está compuesto por dos controladores: un controlador LQG-Integral y un controlador basado en aprendizaje por refuerzo. El controlador LQG-Integral (Linear Quadratic Gaussian) se encargó del seguimiento preciso de la trayectoria para las coordenadas de posición del dron. Este controlador fue comparado con controladores PID y LQG en términos de precisión, estabilidad y respuesta dinámica. Los resultados demostraron que el LQG-Integral es el más efectivo, eliminando errores en estado estable y proporcionando un seguimiento de trayectoria superior. Por otro lado, el controlador de alto nivel basado en la estrategia de aprendizaje por refuerzo DDDQN (Dueling Double Deep Q-Network), fue responsable de la planificación de trayectorias locales y la evasión de obstáculos. Este controlador permitió al dron navegar de manera eficiente en el entorno simulado, evitando obstáculos de forma efectiva. La implementación y prueba del sistema en el simulador Gazebo permitieron validar el comportamiento del dron en un entorno con dinámica realista, sin necesidad de pruebas en drones y cultivo reales. Durante el entrenamiento, el agente autónomo mostró una notable mejora en la navegación, reduciendo la longitud de las rutas y minimizando la activación de las rutinas de evasión de emergencia, evidenciando un avance constante en su rendimiento y eficiencia.
Description
Keywords
VANT, Control LQG, Mecánica Lagrangiana, Inteligencia artificial, Aprendizaje por Refuerzo, dron hexacóptero, planeación de trayectoria local, palma de aceite
Citation