Neuer Journal-Artikel für die MACH 2021 akzeptiert
Beim Aktiven Lernen auf Datenströmen (engl. stream-based active learning) werden Datenpunkte innerhalb eines Datenstroms identifiziert, die für das Training des aktuell genutzten Klassifikators nützlich sein können. Die Klassen dieser Datenpunkte sind unbekannt, daher werden diese einem Orakel übergeben, welches diesen Datenpunkt jeweils eine Klasse zuweist (annotiert). Im aktuellen Stand der Technik gilt die Annahme, dass das Orakel diese Daten sofort annotiert und diese Annotation sofort zur Verfügung stehen. Durch eine limitierte Anzahl an Experten oder aufwändige Computersimulationen können hierbei jedoch Verzögerungen auftreten (engl. verification latency). In "Stream-Based Active Learning for Sliding Windows Under Verification Latency" untersuchen Tuan Pham, Daniel Kottke, Georg Krempl und Bernhard Sick, wie sich solche Verzögerungen im Aktiven Lernen mit Datenströmen auswirkt. Die Autoren zeigen, dass durch frühzeitiges Vergessen und Simulieren von noch nicht vorhandenen Annotationen, aktive Lernstrategien des aktuellen Stand der Technik eine intelligentere Auswahl der zu annotierenden Datenpunkte treffen können.