Einstieg in MLOps, Teil 3: Modelltraining für Fortgeschrittene in Kubeflow

Wir zeigen Ihnen, wie man mit großen Modellen wie ChatGPT, Bard oder LLaMA umgeht und wie Transferlernen, Feintuning und Retraining funktioniert.

Artikel verschenken

11.09.2023, 15:00 Uhr

Lesezeit: 13 Min.

iX Magazin

Von

Dr. Sebastian Lehrig

Einstieg in MLOps, Teil 3: Modelltraining für Fortgeschrittene in Kubeflow
- Transferlernen und Feintuning als Basis
Trainingsbeschleunigung und Outsourcing
Verteiltes Training und MPIJob-Ressource nutzen
Monitoring und weitere Funktionen
Ausblick

Artikel in iX 10/2023 lesen

Für das Arbeiten mit großen Sprachmodellen wie ChatGPT, Bard oder LLaMA mit mehreren Milliarden an Parametern muss man den eigenen MLOps-Ansatz um fortgeschrittene Techniken erweitern. Zum Optimieren von Trainingszeiten und Modellgüte nutzen Data Scientists etwa Transferlernen und Feintuning von vorgefertigten Basismodellen, setzen zusätzliche oder spezialisierte Hardware ein, mieten Ressourcen aus der Cloud an und verteilen das Training über mehrere Rechenknoten.

Ein Monitoring per TensorBoard gibt Entwicklern hierbei kontinuierlich Rückmeldung zu Trainingsstatus und Modellgüte. Nach dieser Groboptimierung wiederholt man gegebenenfalls das Modelltraining auf aktuelleren Trainingsdaten und verfeinert die Trainingsparameter per AutoML und Hyperparameter-Tuning. Wie sich alle diese Techniken in Kubeflow integrieren lassen, zeigt dieser letzte Teil des Tutorials.

Dr. Sebastian Lehrig leitet MLOps mit Open Source bei IBM. Sein Ziel: Lösungen optimiert auf IBM-Infrastruktur anbieten – maximal effizient, sicher und zuverlässig.

Die beiden ersten Artikel dieser Serie haben gezeigt, wie Data Scientists mit Kubeflow-Pipelines KI-Modelle erstellen, deployen, managen und nutzen können. Die Klassifizierung des Iris-Datasets als Beispiel war hierfür zweckmäßig, da es sich mit wenigen Ressourcen und einfachen Modellen gut analysieren lässt. Die bisher vorgestellten Techniken eignen sich allerdings nicht, um rechenintensivere und komplexere Modelle zu trainieren.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Kamerasensoren erklärt: So wird aus Licht ein Bild

Die Bauart eines Kamerasensors beeinflusst die Bildqualität. Wir erklären, wie, und was das für Ihre Fotos bedeutet.

Workshop: Frontplatten mit System zum Selberbauen

Ein Mosaiksystem ist eine modulare Lösung für Frontplatten von Selbstbaugeräten. Mit OpenSCAD geplant, sind die Frontplatten extrem flexibel einsetzbar.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Unbekannte haben einen dubiosen Server unter dem Domainnamen fritz.box betrieben. Wir zeigen, wie man unerwünschten Verkehr mit zweifelhaften Servern vermeidet.

ChatGPT: Was der Sprachbot alles kann und wann sich ein Abo lohnt

OpenAI entwickelt ChatGPT laufend weiter. Er führt Gespräche, malt Bilder und analysiert Dokumente. Wir zeigen die Einsatzfelder und wo Sie aufpassen sollten.

Vorderseite des iPad Air 13" mit angedocktem Apple Pencil Pro

Apple iPad Air 2024 mit 13"-Display im Test: Das bezahlbare Pro

An Bord hat das neue iPad Air einige Features der teuren Pro-Modelle. Wir klären, für wen angesichts der Preisunterschiede ein Air das bessere Pro ist.

iPad Pro 2024 im Test

iPad Pro M4 mit Magic Keyboard und Apple Pencil

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Das iPad Pro ist flacher und schneller als jedes Apple-Tablet zuvor. Wir haben das Spitzenmodell mit entspiegeltem OLED-Display getestet. Lohnt der Umstieg?

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Kamerasensoren erklärt: So wird aus Licht ein Bild

Die Bauart eines Kamerasensors beeinflusst die Bildqualität. Wir erklären, wie, und was das für Ihre Fotos bedeutet.

Workshop: Frontplatten mit System zum Selberbauen

Ein Mosaiksystem ist eine modulare Lösung für Frontplatten von Selbstbaugeräten. Mit OpenSCAD geplant, sind die Frontplatten extrem flexibel einsetzbar.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Unbekannte haben einen dubiosen Server unter dem Domainnamen fritz.box betrieben. Wir zeigen, wie man unerwünschten Verkehr mit zweifelhaften Servern vermeidet.

ChatGPT: Was der Sprachbot alles kann und wann sich ein Abo lohnt

OpenAI entwickelt ChatGPT laufend weiter. Er führt Gespräche, malt Bilder und analysiert Dokumente. Wir zeigen die Einsatzfelder und wo Sie aufpassen sollten.

Apple iPad Air 2024 mit 13"-Display im Test: Das bezahlbare Pro

An Bord hat das neue iPad Air einige Features der teuren Pro-Modelle. Wir klären, für wen angesichts der Preisunterschiede ein Air das bessere Pro ist.

iPad Pro 2024 im Test

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Das iPad Pro ist flacher und schneller als jedes Apple-Tablet zuvor. Wir haben das Spitzenmodell mit entspiegeltem OLED-Display getestet. Lohnt der Umstieg?

nach oben

Alle Angebote

Newsletter heise-Bot

${intro} ${title}

${intro} ${title}

Einstieg in MLOps, Teil 3: Modelltraining für Fortgeschrittene in Kubeflow

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Kamerasensoren erklärt: So wird aus Licht ein Bild

Workshop: Frontplatten mit System zum Selberbauen

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

ChatGPT: Was der Sprachbot alles kann und wann sich ein Abo lohnt

Apple iPad Air 2024 mit 13"-Display im Test: Das bezahlbare Pro

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Kamerasensoren erklärt: So wird aus Licht ein Bild

Workshop: Frontplatten mit System zum Selberbauen

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

ChatGPT: Was der Sprachbot alles kann und wann sich ein Abo lohnt

Apple iPad Air 2024 mit 13"-Display im Test: Das bezahlbare Pro

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Spiele

1 Jahr nur 1,90 € pro Woche

Das digitale Abo für IT und Technik.