iX 10/2023
S. 44
Titel
StarCoder

Eigene Coding-Assistenten trainieren und nutzen

Per QLoRA-Feintuning lernen Coding-Assistenten die Quellcodebasis des eigenen Projekts oder Unternehmens kennen. Im Zusammenspiel mit Containersoftware und MLOps-Werkzeugen sind die individuellen Sprachmodelle schnell unternehmensweit einsatzbereit.

Von Ramon Wartala

KI-basierte Coding-Assistenten wie GitHub Copilot sind praktisch. In die Lieblings-IDE eingebettet, erzeugen sie während des Tippens im Quellcode Vorschläge. Es genügt, einen Kommentar oder einen Funktionsaufruf zu beginnen und kurz innezuhalten. Der Coding-Assistent übermittelt den Kontext und zeigt dem Benutzer einen Vorschlag inline an. Zum Übernehmen reicht ein Druck auf die Tab-Taste; möchte man den Code nicht, schreibt man einfach weiter.

Was GitHub Copilot (noch) nicht erlaubt, ist das Feintuning mit eigenen Daten, also das Anpassen auf die Codekonventionen des Unternehmens oder auf selbst entwickelte Bibliotheken und Programme. Und selbst wenn Microsoft oder OpenAI dies einmal anbieten sollten, ist es fraglich, ob man dann wirklich bereit ist, seinen Code mit externen Anbietern zu teilen. Das gilt nicht nur wegen etwaiger Geschäftsgeheimnisse, sondern auch wegen der DSGVO, denn gar nicht so selten verstecken sich im Code auch personenbezogene Daten.

Kommentieren