CLAUDE.md Kontext-Optimierung Review

07.04.2026 · ai-tools

Bei einem Review meiner KI-Infrastruktur fiel mir auf, dass meine zentrale Kontext-Datei (CLAUDE.md) auf fast 400 Zeilen angewachsen war. Da zu viel irrelevanter Kontext die Problemlösungsfähigkeit von KI-Agenten nachweislich verschlechtert, habe ich mein Setup radikal verschlankt und gleichzeitig mein Modell-Routing optimiert.

Modulare Wissenshappen statt Monolith

Anstatt der KI bei jeder Anfrage alle Details zu meinen einzelnen Services mitzugeben, habe ich fast 100 Zeilen spezifischer Anleitungen aus der Hauptdatei ausgelagert. Die CLAUDE.md enthält nun nur noch die wichtigsten Kernprinzipien. Für spezifische Details weise ich die KI im Hauptdokument lediglich an: "Wenn du an Service X arbeitest, lies zuerst die Datei im entsprechenden Unterordner".

Durch diesen Just-in-Time-Kontext holt sich die KI das Detailwissen nur dann, wenn sie es für die aktuelle Aufgabe wirklich braucht. Das spart Tokens und erhöht die Präzision der Antworten spürbar.

Flexibles Routing über ein LLM-Gateway

Gleichzeitig zeigten sich bei meinem bisherigen günstigen Standard-Modell für einfache Aufgaben immer wieder Timeouts. Da meine Anwendungen nicht direkt mit den APIs, sondern über ein LLM-Gateway kommunizieren, konnte ich die Modelle einfach austauschen, ohne den Code meiner Anwendungen anzufassen. Mein Setup sieht nun so aus:

* Mein "Heavy Lifter" für komplexe Architektur- und Designfragen bleibt Claude 3.5 Sonnet. * Für einfache Routine- und Programmieraufgaben nutze ich nun neue, günstigere Alternativen wie Gemma 4 (über das Google AI Studio) und MiniMax M2.5.

Das Gateway erlaubt es mir, A/B-Tests durchzuführen und einfache Aufgaben an die günstigen Modelle zu senden. Nur bei echtem Bedarf eskaliere ich auf das teure Premium-Modell.

Die wichtigsten Erkenntnisse für dein Setup: Widerstehe dem Drang, alles in den globalen System-Prompt zu packen, und setze stattdessen auf modulare, bedarfsgesteuerte Dokumentation. Wenn du zudem deine Automatisierungen nicht hart an ein spezifisches Modell bindest, sondern ein Gateway dazwischenschaltest, bleibst du flexibel und kannst jederzeit auf die effizientesten Modelle am Markt wechseln.