iX 11/2023
S. 120
Praxis
MLOps

MLOps mit SageMaker Pipelines

AWS SageMaker ist Amazons Plattform für Machine-Learning-Projekte. Der Service SageMaker Pipelines soll ML und CI/CD zusammenführen. iX zeigt, wie das funktioniert und für wen sich die Plattform lohnt.

Von Franz Eigner

Data Scientists investieren während Machine-Learning-Projekten viel Zeit in das Aufbereiten von Daten, das Entwickeln von Modellen und das schlussendliche Bereitstellen des Modells als Service. Mit MLOps und dem Erstellen von Datenpipelines lassen sich diese Prozesse effizienter und produktiver gestalten. Entwickler können fertige Pipelines durch das Austauschen verschiedener Komponenten unkompliziert für neue Projekte anpassen. Mittlerweile finden sich viele Plattformen und Cloud-Services für MLOps. Dieser Artikel stellt AWS SageMaker Pipelines anhand eines Praxisbeispiels vor.

Als Beispiel dient eine Pipeline für einen Service, der Vorhersagen darüber treffen soll, ob eine Bank einen Kreditantrag akzeptiert oder nicht. Die für das Modelltraining benötigten Daten liegen dabei in der Regel als Tabelle vor. In jeder Zeile sind Informationen über den Kunden gespeichert, etwa das monatliche Einkommen oder die Wohnsituation. Zusätzlich benötigt das Modelltraining die Zielvariable, auch Target genannt – hier also, ob der Kunde letztendlich den Kredit erhalten hat. Da es sich in diesem Fall um eine Ja-Nein-Entscheidung handelt, spricht man von einer binären Klassifikationsaufgabe.

Kommentieren