iX 5/2019
S. 42
Titel
Maschinelles Lernen I

Reinforcement Learning, Teil 1: Grundlagen der maschinellen Entscheidungsfindung

Annäherung

Gerhard Völkl

Versuch und Irrtum prägen nicht nur menschliches Lernen, auch Computerprogramme können ihren Handlungsspielraum über das Erforschen ihrer Umgebung erweitern. Wie Reinforcement Learning – maschinelles Lernen durch Belohnung – funktioniert, zeigen Beispiele mit Python und TensorFlow.

Dass Computer mit Methoden des maschinellen Lernens Katzen in Bildern erkennen, ist keine Sensation mehr. Die nächste Herausforderung besteht darin, dass ein Computer lernt, selbstständig sinnvolle Entscheidungen zu treffen – etwa in Videospielen mehr Punkte zu holen als ein durchschnittlicher menschlicher Spieler. Mit Reinforcement Learning (RL) kann das gelingen.

„Computer bringt sich selbst Go bei – und wird Weltklasse“, „Roboter lernen im Turbo-Tempo“ und „Künstliche Intelligenz bewältigt 49 Atari-Spiele“ sind Schlagzeilen, hinter denen dieser spe­zielle Bereich des Machine Learning (ML) steckt, das Lernen durch Belohnung.

Kommentieren