Identifikation nichtlinearer Zustandsraummodelle mit Rekurrenten Neuronalen Netzen
Bearbeiter
Laufzeit
1/2018 - 3/2021
Förderung
Land Hessen
Kurzbeschreibung
Die Effizienz von Methoden zur Simulation und Prognose technischer Systeme sowie für den Reglerentwurf hängt direkt von der Qualität der zugrundeliegenden Modelle ab. Aufgrund der zunehmenden Komplexität technischer Systeme wird die Bildung qualitativ hochwertiger physikalischer Modelle derart erschwert, dass die datengetriebene Modellbildung oft den einzig gangbaren Weg darstellt. In der datengetriebenen Modellbildung werden Modelle mit interner Dynamik und Modelle mit externer Dynamik unterschieden. Während der Ansatz externer Dynamiken am weitesten verbreitet ist, eignet er sich weniger gut für Systeme mit vielen Einggangs- und Ausgangsgrößen (MIMO-Systeme). Inbesondere kommt es zu einer Explosion des Eingangsdatenraums, was zu einer großen Anzahl erforderlicher Trainingsdaten führt sowie einer unüberschaubaren kombinatorischem Vielfalt bei der Regressorauswahl.
Bei Modellen mit interner Dynamik hingegen handelt es sich um Zustandsraummodelle, sodass keine verzögerten Terme der Ein- und Ausgangsgrößen berücksichtigt werden müssen. Dafür sind die internen Zustände in der Regel unbekannt, sodass das zu lösende Optimierungsproblem bei der Parameterschätzung ungleich schwieriger ist. Moderne Rekurrente Neuronale Netze (RNN), sogenannte Gated Units, scheinen deutlich schneller zu konvergieren und weniger stark initialisierungsabhängig zu sein, als klassische RNN, wie Elman-Netze. Obwohl Gated Units bspw. in der Sprachverarbeitung, Zeitreihenvorhersage und Objekterkennung mittlerweile Stand der Technik sind, gibt es nahezug keine Anwendung auf dem Gebiet der Systemidentifikation.
Publikationen zum Projekt
- Alexander Rehmer, Marco Klute, Andreas Kroll, Hans-Peter Heim: An internal dynamics approach to predicting batch-end product quality in plastic injection molding using Recurrent Neural Networks, IFAC-PapersOnLine, 6th IEEE Conference on Control Technology and Applications (CCTA), 53, 1427-1432, Elsevier, 2022
- Alexander Rehmer, Andreas Kroll: On affine quasi-LPV System Identification with unknown state-scheduling using (deep) Recurrent Neural Networks, IFAC-PapersOnLine, Proceedings of the 26th International Conference on System Theory Control and Computing (ICSTCC), 446-451, 2022
- Alexander Rehmer, Andreas Kroll: Eine Python-Toolbox zur datengetriebenen Modellierung des Spritzgieprozsses und Lösung von Optimalsteuerungsproblemen zur Steuerung der Bauteilqualität, 32. Workshop Computational Intelligence, 133-150, KIT Scientific Publishing, https://library.oapen.org/handle/20.500.12657/59840?show=full, 2022
- Alexander Rehmer, Andreas Kroll: A Deep Recurrent Neural Network model for affine quasi-LPV System identification, Preprints of the 20th European Control Conference (ECC), 566-571, 2022
- Alexander Rehmer, Andras Kroll: The effect of the forget gate on bifurcation boundaries and dynamics in Recurrent Neural Networks and its implications for gradient-based optimization, Preprints of the International Joint Conference on Neural Networks (IJCNN 2022), 1-8, 2022
- Alexander Rehmer, Andreas Kroll: On the vanishing and exploding gradient problem in Gated Recurrent Units, IFAC-PapersOnLine, 21th IFAC World Congress, 53, 2, 1243-1248, Elsevier, 2020
- Alexander Rehmer, Andreas Kroll: On Using Gated Recurrent Units for Nonlinear System Identification, Preprints of the 18th European Control Conference (ECC), 2504-2509, https://www.ifac-control.org/events/european-control-conference-in-cooperation-with-ifac-ecc-2019, 2019