Una profunda inmersión en el problema del valor renal resolviendo en el control óptimo

¿Cuáles son los problemas de valor monetario en el control óptimo?

La teoría de control óptimo proporciona un marco matemático para determinar una política de control que minimiza o maximiza un índice de rendimiento a lo largo del tiempo, sujeto a limitaciones dinámicas. En el corazón de muchas formulaciones de control óptimos se encuentra la necesidad de resolver un problema de valor límite (BVP).Un problema de valor límite es un sistema de ecuaciones diferenciales ordinarias o parciales acompañadas de condiciones que deben ser satisfechas en dos o más puntos distintos de la variable independiente#8212;

Comprender las prácticas comerciales es esencial porque rigen el comportamiento óptimo de una amplia gama de sistemas: desde la optimización de la trayectoria espacial y la planificación de los movimientos robots hasta el control de procesos químicos y la modelización del crecimiento económico. La complejidad de las prácticas comerciales basadas en su naturaleza no local denominada “cl#8212”; la solución en cualquier momento depende de las condiciones en ambos límites, lo que hace más difícil resolver analíticamente que los problemas de valor inicial.

Formulación de la BVP en Control Optimal

La formulación de un BVP en control óptimo comienza típicamente con un sistema dinámico descrito por las ecuaciones de неритимиитиние / tring

\[\dot{\mathbf{x}(t) = \mathbf{f}(\mathbf{x}(t), \mathbf{u}(t), t), \quad \mathbf{x}(t 0) = \mathbf{x} 0\0\]

donde \(\mathbf{x}(t) \in \mathbb{R}^n\) es el vector del estado, \(\mathbf{u}(t) \in \mathbb{R}^m\) es el vector de control, y \(t 0\) es la hora inicial. El objetivo es encontrar un control \(\mathbf{u}(t)\)

\[J = \phi(\mathbf{x}(t f), t f) + \int {t 0}^{t f} L(\mathbf{x}(t), \mathbf{u}(t), t) \, dt\]

sujeto a limitaciones terminales \(\psi(\mathbf{x}(t f), t f) = 0\).

Aplicando PMP, definimos el Hamiltonian: \(H = L + \boldsymbol{\lambda}^T \mathbf{f}\), donde \(\boldsymbol{\lambda}(t) \in \mathbb{R}^n\) son variables costate (también llamadas variables adjoint).Las condiciones necesarias para la óptimaidad son:

Ecuaciones estatales: \(\dot{\mathbf{x} = \partial H / \partial \boldsymbol{\lambda}\)
Ecuaciones Costadas: \(\dot{\boldsymbol{\lambda}} = -\partial H / \partial \mathbf{x}\)
Condición de la estabilidad: \(\partial H / \partial \mathbf{u} = 0\)
Condiciones de los resultados: \(\mathbf{x}(t 0) = \mathbf{x} 0\); \(\boldsymbol{\lambda}(t f) = \left( \partial \phi / \mathbf{x} + \boldsymbol{\nu}{\)}T \partial \psi / \fright

La condición de la estacionaridad se puede utilizar para eliminar el control en términos de estado y costate, dando un sistema acoplado de 2n ecuaciones diferenciales ordinarias de primer orden (ODEs) con condiciones de límite dividido entre los tiempos iniciales y finales. Este es el TPBVP que debe ser resuelto.

El sistema Hamiltoniano

El sistema Hamiltoniano consiste en las ecuaciones estatales y costatas. Para un problema de control óptimo típico sin restricciones de la trayectoria, estas ecuaciones forman un sistema Hamiltoniano que preserva el valor Hamiltoniano a lo largo de una trayectoria óptima si el sistema es autónomo y el costo terminal no tiene dependencia temporal explícita. Las ecuaciones estatales se propagan hacia adelante, mientras que las ecuaciones costates se propagan hacia atrás a tiempo.

Condiciones de los límites y la transparencia

Las condiciones de los límites en el control óptimo Las BVP son más que estados iniciales y finales fijos. Incluyen:

нертитититинитинитинитин: segÃon / setÃ3n \(\mathbf{x}(t 0) = \mathbf{x} 0\).
нертенниенниенным estado final con costo terminal: se realizó / fuerte confianza El costado en la última vez satisfies transversalidad condiciones \(\boldsymbol{\lambda}(t f) = \partial \phi / \mathbf{x} \big perpetua {t f}\).
لринитиними \ nx\cncipal restricciones: segn/t f) = 0\), la condición de la transversalidad se convierte en \(\boldsymbol{\lambda}(t f) = \partial \fi / \partial \mathbf{x} + \boldsymbol{nu
неритенилиный tiempo final: se realizó / se entrenó un estado adicional \(\left( H + \partial \phi / \partial t \right) {t f} = 0\) debe ser satisfecho.

La formulación adecuada de estas condiciones de frontera es crítica. Las condiciones desfavorables pueden llevar a la inestabilidad numérica o a la convergencia a soluciones no óptimas. Para un tratamiento minucioso de las condiciones de transversalidad, vea el texto clásico de Bryson y Ho.

Métodos para resolver problemas de valor renal

Debido a que las soluciones analíticas a las PVB en control óptimo son raramente posibles excepto para sistemas muy simples (por ejemplo, regulador lineal cuadrático con tiempo final fijo), los métodos numéricos son esenciales. Las principales categorías incluyen métodos de disparo, métodos de diferencia finitos y métodos de colocación. Cada uno tiene fortalezas y debilidades dependiendo de la estructura y dimensionalidad de problemas.

Métodos de disparo

Los métodos de disparo transforman el BVP en un problema de valor inicial (IVP) adivinando las condiciones iniciales perdidas (normalmente la costa inicial) y luego integrando el sistema Hamiltonian hacia adelante al tiempo terminal. El desajuste terminal (diferencia entre las condiciones finales computadas y las condiciones terminales deseadas) se utiliza para actualizar la conjetura. Este proceso iterante es esencialmente resolver un problema de determinación de raíz no lineal.

Los métodos de tiro son intuitivos y aprovechan a los integradores maduros de ODE. Sin embargo, pueden ser sensibles a las malas adivinaciones iniciales y pueden fallar por problemas con horizontes largos o alta sensibilidad a las condiciones iniciales.

Métodos de diferenciación finita

Los métodos de diferencia finita descretizan la dinámica del estado y costan directamente en una red de puntos de tiempo. Las ecuaciones diferenciales se reemplazan por aproximaciones de diferencia finita (por ejemplo, Euler adelante, trapezoidal o esquemas Runge-Kutta).Las condiciones de límite se convierten en restricciones de igualdad en los primeros y últimos puntos de rejilla. El resultado es un gran sistema de ecuaciones algebraicas que deben resolverse simultáneamente hacia adelante

Los métodos de diferencia finita proporcionan una alternativa robusta, especialmente para problemas con la estructura de solución conocida. Requieren resolver grandes sistemas lineales en cada iteración de Newton, que pueden ser costosos computacionalmente para espacios estatales de alta dimensión pero se benefician de la paralización y técnicas de matriz escasa.

Métodos de ubicación

Los métodos de ubicación representan las trayectorias estatales y de control como polinomios de ancho de pieza (usualmente líneas) y hacen cumplir las ecuaciones diferenciales exactamente en un conjunto de puntos de ubicación dentro de cada intervalo de tiempo.Las condiciones de límite y las condiciones de continuidad entre intervalos se imponen como restricciones adicionales.El problema de programación no lineal resultante (NLP) se puede resolver utilizando optimizadores fuera de la plataforma como IPOPT o SNOPT.

Para una comparación detallada de los métodos numéricos de BVP, vea Ascher, Mattheij y Russell's יa href="https://epubs.siam.org/doi/book/10.1137/1.9781611971237" target=" blank" rel="noopener noreferrer" ES"Numerical Solution of Boundary Value Problems for Ordinary.

Elegir el método correcto

La elección del método depende de varios factores:

■strong confianzaTamaño del proyecto: Secuencia/fuerte contacto Para estado de baja dimensión (n ≤ 10), los métodos de disparo son a menudo adecuados. Para problemas de alta dimensión o gran escala, la colisión o la diferencia finita puede escalar mejor.
■Stiffness of the dynamics: Se realizaron / se entretenían sistemas Stiff que requieren una integración implícita, que la colilocación y la diferencia finita manejan naturalmente.
√STRUJEJERES DE Availabilidad de una buena adivinación inicial: Se realizaron / se entretenieron métodos de tiro con confianza en la calidad de adivinación inicial. Si se dispone de una aproximación aproximada de la trayectoria óptima (por ejemplo, de un modelo heurístico o simplificado), el tiroteo puede converger rápidamente.
لрентеннитининих: Secuencia/fuertengilo Cuando existen restricciones de desigualdad en estados o controles, los métodos de transcripción directa (collocación) son generalmente más flexibles.

Retos y consideraciones

La solución de las prácticas de protección antirretroviral en un control óptimo no es una tarea rutinaria; hay que abordar varios desafíos.

Sensibilidad y Convergencia

Los pequeños cambios en las condiciones de límites desconocidas pueden causar grandes desviaciones en el estado final debido al crecimiento exponencial de errores en direcciones inestables. Esto es particularmente agudo en el simple tiroteo, que puede exhibir mal condicionado. Múltiples estrategias de tiro y mecanizado mitizan esto proporcionando un problema mejor condicionado. Además, los métodos Newton para el paso de la determinación de raíces requieren Jacobianos precisos, que pueden obtenerse a través de diferencias finitas o diferenciación automática.

Escala y Normalización

Variables (estados, costates, tiempo) a menudo abarcan diferentes órdenes de magnitud. El mal escalado conduce a Jacobianos mal condicionados y la lenta convergencia. Normalizar el tiempo a un intervalo fijo (por ejemplo, [0,1]) y escalar estados a rango de unidad son pasos preprocesadores estándar. Para problemas con tiempo final libre, el horizonte de tiempo se trata a menudo como una variable desconocida adicional, y la dinámica se transforma a un tiempo normalizado.

Arcos y soluciones no monetarias

En algunos problemas de control óptimos, el Hamiltonian puede ser lineal en el control, lo que lleva a тренирининиенининиениянияных de control, donde la condición de la estacionaridad no determina el control. Estos arcos requieren un manejo especial, como el uso de los derivados del tiempo de la función de conmutación desaparecen.

Costo computacional

Los sistemas de alta dimensión (n √≥ 50) son comunes en aeroespacial y robótica. Los métodos de diferencia finita y de colocación conducen a grandes NLP con miles de variables y limitaciones. Eficientes técnicas de álgebra lineal y descomposición (por ejemplo, programación cuadrática secuencial) son esenciales. Los métodos de tiro pueden ser más eficientes para dimensiones moderadas si las dinámicas son baratas para integrarse.

Aplicaciones y estudio de caso en el mundo real

El problema del valor monetario que se resuelve en un control óptimo no es un ejercicio académico denominado#8212; se emplea diariamente en el diseño y las operaciones de ingeniería.

Aeroespacial: Ascenso de vehículos de lanzamiento

Una de las aplicaciones clásicas es el ascenso óptimo de un vehículo de lanzamiento de la Tierra a la órbita. La dinámica del vehículo implica movimiento tridimensional, masa variable debido a la quemadura de combustible y arrastre atmosférico. El objetivo es minimizar el consumo de combustible (o maximizar la carga útil). El TPBVP resultante incluye restricciones terminales en altura, velocidad y ángulo de trayectoria de vuelo.

Robotics: Sendero Optimal Tiempo Después

Para los manipuladores robóticos encargados de seguir un camino geométrico prescrito, el problema de control óptimo reduce a minimizar el tiempo de traversal sujeto a límites de par. La dinámica conduce a un conjunto de ecuaciones diferenciales con condiciones de límite en posición y velocidad al inicio y final del camino. Los métodos de colisión se destacan aquí porque el camino puede ser parametizado por una sola variable escalar, dando lugar a un pequeño BVP que puede ser resuelto en tiempo real.

Economía: Modelos de crecimiento óptimos

En macroeconómicos, el modelo de crecimiento de Ramsey busca encontrar la ruta de consumo que maximiza el bienestar social en un horizonte infinito. Esto conduce a una BVP con ecuaciones estatales (capital) y costates (precio suficiente) con condiciones de transversalidad en infinito (a menudo aproximada a un tiempo finito grande). Numerosos métodos de tiro con condiciones límite asintomático se aplican comúnmente.

Ejemplo ilustrativo: Problema simple de una dimensión

\ n) Considéralo con la solución de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea de la línea.

Conclusión

Los problemas de valor Boundope=0 de la aplicación óptima de análisis y diseño. Desde la formulación teórica pasando por el Principio máximo de Pontryagin a la solución numérica práctica utilizando métodos de tiro, diferencia finita o de colisión, entender los BVP es indispensable para cualquier persona que trabaje con optimización dinámica.