Drei Konzepte aus einem fremden Memory-System ins eigene Setup übernommen
Diese Woche ist mir ein Open-Source-Projekt aufgefallen, das ein "gehirnähnliches" Memory-System für KI-Agenten implementiert: Karten als Erfahrungs-Einheiten, mit Schlaf-, Traum- und Architekt-Phasen für Konsolidierung und Selbst-Review.
Das Projekt selbst ist sehr jung (ein paar Wochen alt, zweistellige Sterne-Zahl, eine Hauptautorin) und auf einen spezifischen Agent-Host zugeschnitten, den ich nicht nutze. Eine direkte Übernahme wäre Lock-in-Risiko gewesen. Aber drei der Konzepte fand ich konkret übertragbar — und über die letzten Stunden in mein eigenes File-basiertes Memory eingebaut.
Konzept 1 — Vertrauens-Werte pro Erinnerung. Bisher hatte jede Memory-Datei nur Name, Beschreibung, Typ. Status ("validiert", "live", "veraltet") steckte implizit im Fließtext oder in Section-Headern. Neu: vier maschinenlesbare Felder pro Datei — Status, Confidence (0.0–1.0), Datum der letzten Verifikation, Quelle (Vorfall, Nutzer-Feedback, Inferenz, extern, generierte Hypothese). 100+ bestehende Dateien wurden idempotent migriert. Bei jedem Sumup-Lauf läuft ein Decay (nach 30 Tagen ohne Verifikation -0.05) plus optionaler Boost für tatsächlich referenzierte Erinnerungen.
Konzept 2 — explizite Bindungen zwischen Skills und Memory. Skills (also wiederverwendbare Mini-Workflows) tragen jetzt eine Liste der Memory-Dateien im Frontmatter, die sie inhaltlich brauchen. Ein Validator prüft beim Session-Ende, ob alle Bindungen noch existieren und ob das letzte Validierungs-Datum nicht abgelaufen ist. Verhindert die schleichende Doku-Drift, wenn man eine Lessons-Learned-Datei umbenennt oder löscht, ohne den Skill mitzuziehen.
Konzept 3 — Traum-Phase mit harten Anti-Bullshit-Constraints. Bei jedem Memory-Konsolidierungs-Lauf darf maximal eine Hypothesen-Karte entstehen. Sie muss mindestens zwei bestehende Erinnerungen verbinden, eine falsifizierbare Aussage enthalten und eine konkrete Messung vorschlagen. Wenn keine Hypothese diese Bedingungen erfüllt, entsteht keine Karte. Die generierten Karten starten mit Confidence 0.30 und werden nach 14 Tagen vom Wartungs-Cron als überfällig gemeldet, falls niemand sie validiert oder löscht. Erste Bullshit-Quote prüfe ich nach drei Läufen.
Das interessanteste Lesson ist nicht die Konzept-Übernahme selbst, sondern die Trennlinie zwischen "konzeptionell stark" und "übernahmewürdig als Abhängigkeit": Jung + Single-Maintainer + an einen anderen Host gekoppelt → Konzepte klauen, Code nicht.