Thomas Winkler - KI-Tools & AI-Strategien für Produkt-, Design- und Innovationsmanagement

Setup-Überblick

Mein AI-Setup im Überblick

Zuletzt aktualisiert: 03.06.2026

Eine aktuelle Übersicht meines persönlichen AI-Setups für Produkt-, Design- und Innovationsmanagement.

Inferenz-Optimierung in KMU-Stack-Templates vorgemerkt

03.06.2026 · ai-tools

Ich habe festgestellt, dass in vielen KMU-Stack-Templates die Inferenzkosten für LLM-Aufrufe unnötig hoch sind. Das Problem: Standard-Implementierungen nutzen oft Default-Einstellungen, die weder auf...

Weiterlesen →

Gateway-Validierung: warum ich LiteLLM behalten habe (und drei Features geklaut)

27.05.2026 · ai-tools

Heute stand die Evaluierung verschiedener kommerzieller KI-Gateways auf dem Plan, um die Kostenkontrolle und Latenz im Produktivbetrieb zu optimieren. Anstatt jedoch das bestehende Self-Hosted-Setup a...

Weiterlesen →

Setup-Update 26.05.2026: 2 Verbesserungen

26.05.2026 · ai-tools

Ein LLM-basierter Code-Assistent hatte in Tests immer wieder unauffällige, aber potenziell unsichere Code-Passagen durchgewinkt – besonders bei Abhängigkeiten mit versteckten Rückruf-Funktionen. Ich b...

Weiterlesen →

MCP-Aggregator: 3-4x mehr Concurrent Users auf gleicher KI-Hardware

22.05.2026 · ai-tools

Wenn ein lokales KI-Modell auf dutzende Unternehmenssysteme zugreifen soll, geht die Hardware oft schon bei wenigen gleichzeitigen Nutzern in die Knie. Das Problem ist nicht das Modell selbst, sondern...

Weiterlesen →

Setup-Update 21.05.2026: 20 Verbesserungen

21.05.2026 · ai-tools

Heute stand ein umfassendes Setup-Update an, um die Infrastruktur für meine KI-Prozesse im Produkt- und Innovationsmanagement robuster zu machen. Der Fokus lag auf Kosteneffizienz, Datensicherheit und...

Weiterlesen →

Setup-Update 20.05.2026: 17 Verbesserungen

20.05.2026 · ai-tools

Weiterlesen →

Drei Konzepte aus einem fremden Memory-System ins eigene Setup übernommen

15.05.2026 · ai-tools

Diese Woche ist mir ein Open-Source-Projekt aufgefallen, das ein "gehirnähnliches" Memory-System für KI-Agenten implementiert: Karten als Erfahrungs-Einheiten, mit Schlaf-, Traum- und Architekt-Phasen...

Weiterlesen →

Briefing-Generator Cache-Bug gefixt (Semantic-Cache-Hit auf aehnliche Prompts)

15.05.2026 · ai-tools

Ich habe kürzlich ein seltsames Verhalten in einem meiner Briefing-Generatoren beobachtet: Nutzer bekamen Ergebnisse, die nicht exakt zu ihren Eingaben passten. Der Schuldige war schnell gefunden: der...

Weiterlesen →

Setup-Update 11.05.2026: 9 Verbesserungen

11.05.2026 · ai-tools

Ein Tag mit neun Optimierungen – von Kostenersparnis über Workflow-Verbesserungen bis hin zu Monitoring-Klärungen. Hier die umgesetzten Maßnahmen, die direkt in die tägliche Arbeit mit KI in Produkt,...

Weiterlesen →

Setup-Update 05.05.2026: 3 Verbesserungen

05.05.2026 · ai-tools

Heute stand die Optimierung meines KI-Setups auf dem Plan, um Routing-Kosten zu senken, die Sicherheit im Reinforcement-Learning-Loop zu erhöhen und die Dokumentenverarbeitung neu aufzustellen. Solche...

Weiterlesen →

Phantom-Cron-Failure "node-Job" entlarvt + zweistufiger Fix

29.04.2026 · ai-tools

Mein Monitoring schlug plötzlich Alarm, weil ein mysteriöser "node-Job" alle paar Stunden crashte. Statt mich mühsam durch kryptische Server-Logs zu wühlen, habe ich mein LLM als Debugging-Assistenten...

Weiterlesen →

DeepSeek V4 Flash + Pro nativ in LiteLLM eingebunden

29.04.2026 · ai-tools

Um die neuen DeepSeek-Modelle (V4 Flash und V4 Pro) in meinen eigenen Workflows und Prototypen zu testen, ohne jedes Mal den Code anzupassen, setze ich auf ein LLM-Gateway. Statt API-Wildwuchs und unü...

Weiterlesen →

Skills Pattern Audit (Hosni Best-Practices)

29.04.2026 · ai-tools

Meine stetig wachsende Sammlung an Custom GPTs und System-Prompts lieferte zunehmend schwankende Ergebnisse, weil ich sie oft "quick and dirty" erstellt hatte. Um die Qualität systematisch zu heben, h...

Weiterlesen →

Anthropic Persistent Memory Eval

29.04.2026 · ai-tools

Um den täglichen Gedächtnisverlust von KI-Modellen zu umgehen und nicht ständig Projektkontexte neu erklären zu müssen, habe ich eine persistente Memory-Architektur für Anthropic (Claude) aufgebaut un...

Weiterlesen →

Ghost-Container claude-backup aus Monitoring entfernt

22.04.2026 · ai-tools

Beim Blick auf mein Monitoring-Dashboard fiel mir ein roter Warnhinweis auf: Ein Service namens `claude-backup` meldete sich permanent als offline, obwohl ich den Container schon vor Wochen auf dem Se...

Weiterlesen →

Konzept-Dokumente fuer zwei Folge-Projekte

22.04.2026 · ai-tools

Für zwei anstehende Folge-Projekte musste ich Produktanforderungen in klare architektonische Konzept-Dokumente übersetzen. Statt vor einem leeren Blatt zu sitzen, habe ich mein KI-Setup als technische...

Weiterlesen →

Codex-Chronicle-Prinzip evaluiert

22.04.2026 · ai-tools

Um zu verhindern, dass KI-Modelle bei jedem neuen Chat den Projektkontext vergessen, habe ich das "Codex-Chronicle-Prinzip" in meinem Setup evaluiert. Es trennt statische Verhaltensregeln strikt vom d...

Weiterlesen →

Grafana DatasourceNoData Alert gefixt

22.04.2026 · ai-tools

In meinem AI-Setup mit Grafana wurde ich ständig von „DatasourceNoData“-Alerts genervt, weil das System in ruhigen Phasen ohne API-Anfragen fehlende Metriken als Infrastruktur-Ausfall interpretierte....

Weiterlesen →

MiniMax M2.7 + Qwen 3.6 Plus in LiteLLM Cheap-Tier

22.04.2026 · ai-tools

Um meine API-Kosten für tokenintensive, aber simple KI-Aufgaben zu senken, habe ich mein Setup auf eine Routing-Strategie mit LiteLLM umgestellt. Statt für alles teure Flaggschiff-Modelle zu nutzen, t...

Weiterlesen →

Hersteller (OMRC) als erstes Feld in Lieferantenidentifikation

22.04.2026 · ai-tools

Beim Extrahieren von Produktdaten aus unstrukturierten Dokumenten verwechselte meine KI regelmäßig Zwischenhändler und tatsächliche Produzenten. Die Lösung war kein neues Modell, sondern eine simple Ä...

Weiterlesen →

Tolerante CSV-Uploads fuer alle 3 Upload-Sektionen

22.04.2026 · ai-tools

Bisher war jeder CSV-Upload in meinem KI-Setup ein Glücksspiel: Falsche Trennzeichen, abweichende Encodings oder minimal anders benannte Spalten brachten den Datenimport regelmäßig zum Absturz. Um mei...

Weiterlesen →

Workflow-Phasen-Labels umbenannt

22.04.2026 · ai-tools

Wenn mein KI-Setup ein langes Nutzerinterview analysiert oder Lösungsansätze generiert, dauert das oft bis zu dreißig Sekunden. Um diese Wartezeit erträglicher zu machen, habe ich eine winzige, aber e...

Weiterlesen →

Projekt-Dokumentation vollstaendig nachgezogen

22.04.2026 · ai-tools

Nach Wochen schneller Iterationen an meinem KI-Setup hatte sich ein massiver Rückstau an unstrukturierter Dokumentation gebildet. Um diese "Dokumentations-Schuld" aufzulösen, ohne Stunden mit Schreibe...

Weiterlesen →

Artikelanlage-Assistent v2.5: Hersteller, tolerante CSV-Uploads und synchrone Doku

15.04.2026 · ai-tools

Für das Update 2.5 meines Artikelanlage-Assistenten musste ich drei konkrete Praxisprobleme lösen: fehlgeschlagene Datei-Uploads, verwirrende UX-Begriffe und fehlende Herstellerdaten für das ERP-Syste...

Weiterlesen →

Cron-Job Fehler: vault-batch better-sqlite3 ABI-Mismatch

14.04.2026 · ai-tools

Ein stillstehender Cron-Job für meine Vektor-Datenbank zwang mich kürzlich zur Fehlersuche: Nach einem Server-Update auf Node.js 22 crashte die SQLite-Datenbank wegen eines „ABI-Mismatch“. Ein simpler...

Weiterlesen →

Architektur-Review: 5 Fehler vs. OpenClaw + Classifier

14.04.2026 · ai-tools

Ein Artikel über die fünf häufigsten KI-Architekturfehler war der perfekte Anlass, mein eigenes KI-Setup – basierend auf einem dynamischen Classifier und verschiedenen Modell-Ebenen – einem schonungsl...

Weiterlesen →

npm Security Audit + Dependabot Aktivierung

14.04.2026 · ai-tools

Mein organisch gewachsenes KI-Setup brauchte dringend einen Architektur-Frühjahrsputz. Dabei habe ich zwei zentrale Probleme gelöst: die Sicherheit meiner Skripte und die Qualität der Datenextraktion...

Weiterlesen →

Docling PDF-Extraktions-Microservice

14.04.2026 · ai-tools

Bei der Arbeit mit RAG-Systemen und LLMs sind PDFs mit Tabellen und mehrspaltigen Layouts oft ein echter Endgegner. Standard-Text-Extraktoren zerstören die Struktur, was unweigerlich zu Halluzinatione...

Weiterlesen →

LLM-Kosten unter Kontrolle: Virtual Keys und Audit-Architektur als Gatekeeper

10.04.2026 · ai-tools

Als meine KI-API-Kosten plötzlich durch unerkannte Aufrufe des teuren Claude Opus Modells explodierten, wurde mir eine kritische Lücke in meiner Architektur bewusst: Alle meine angebundenen Tools teil...

Weiterlesen →

Wie ich meinen 6000-Notizen-Vault zu einer KI-Wissensquelle gemacht habe

08.04.2026 · ai-tools

Mein Obsidian-Vault mit 6000 Notizen war irgendwann nicht mehr sinnvoll durchsuchbar, also habe ich ihn über das Model Context Protocol (MCP) direkt an meine KI-Assistenten wie Claude und Cursor angeb...

Weiterlesen →

Anthropic-API Drittanbieter-Restriction Check

07.04.2026 · ai-tools

Als Berichte über mögliche API-Restriktionen bei Anthropic für Drittanbieter aufkamen, habe ich sofort mein zentrales LLM-Gateway (LiteLLM) geprüft. Die Entwarnung folgte prompt: Alle Claude-Modelle l...

Weiterlesen →

Gemma 4 als Cheap-Tier-Kandidat in LiteLLM

07.04.2026 · ai-tools

Mein bisheriges "Cheap-Tier"-Modell für einfache Aufgaben fiel in meinem LiteLLM-Gateway ständig mit HTTP-500-Timeouts aus. Um nicht auf teure Premium-Modelle ausweichen zu müssen, habe ich meine Rout...

Weiterlesen →

MiniMax M2.5 als coding-cheap Alias

07.04.2026 · ai-tools

Bisher liefen all meine Programmieraufgaben über ein zentrales LLM-Gateway an teure Top-Modelle wie Claude Sonnet. Um bei simplen Skripten Kosten zu sparen, habe ich eine Routing-Strategie mit dedizie...

Weiterlesen →

CLAUDE.md Kontext-Optimierung Review

07.04.2026 · ai-tools

Bei einem Review meiner KI-Infrastruktur fiel mir auf, dass meine zentrale Kontext-Datei (`CLAUDE.md`) auf fast 400 Zeilen angewachsen war. Da zu viel irrelevanter Kontext die Problemlösungsfähigkeit...

Weiterlesen →

OpenClaw Premium-Leak gestoppt: $6/Tag Einsparung

07.04.2026 · ai-tools

Letzte Woche schoss meine API-Rechnung in die Höhe, weil ein KI-Agent eigenmächtig Premium-Modelle für simple Hintergrundaufgaben nutzte – ein Fehler, der mich 6 Dollar pro Tag kostete. Die Ursache wa...

Weiterlesen →

LLM Request Classifier: Intelligentes Routing ohne Agent-Autonomie

07.04.2026 · ai-tools

Letzte Woche warnte mich mein LLM-Controlling vor einer Kostenexplosion: Ein autonomer Agent hatte in drei Tagen massenhaft teure Premium-Modelle für simple Hintergrundaufgaben genutzt, da in seiner i...

Weiterlesen →

Stagehand SDK fuer Browser-Automation

31.03.2026 · ai-tools

Mein automatisierter "LinkedIn-Monitor" sammelt Branchen-News für mein KI-Setup, doch der primäre Scraper (Camoufox) scheiterte zuletzt immer wieder an Layout-Änderungen oder Timeouts. Als verlässlich...

Weiterlesen →

Guilt-Tripping Hardening fuer OpenClaw Newsletter-Prompt

31.03.2026 · ai-tools

Um zu verhindern, dass meine automatisierte Newsletter-Pipeline "OpenClaw" durch emotionale Sprache in Quelltexten manipuliert wird, habe ich den System-Prompt gegen sogenanntes "Guilt-Tripping" abgeh...

Weiterlesen →

GPT-5.4 Nano Cheap-Tier Evaluation

23.03.2026 · ai-tools

Um meine API-Kosten im lokalen AI-Setup zu optimieren, habe ich das neue GPT-5.4 Nano evaluiert und gleichzeitig mein LLM-Gateway sowie die Anbindung meiner Wissensdatenbank aktualisiert....

Weiterlesen →

MCP SDK Update 1.26.0 → 1.27.1

23.03.2026 · ai-tools

Ich habe kürzlich mein KI-Setup optimiert, indem ich mein LLM-Gateway (LiteLLM) neu konfiguriert und die lokale Werkzeug-Integration über das Model Context Protocol (MCP) auf die SDK-Version 1.27.1 ak...

Weiterlesen →

RL-Loop: Newsletter-Prompt v2

21.03.2026 · ai-tools

Mein automatisiertes KI-Setup für Newsletter-Zusammenfassungen lieferte zwar gute Infos, aber die Handlungsrelevanz ("Actionability") lag bei mageren 5,3 von 10 Punkten. Um aus dem reinen News-Reader...

Weiterlesen →

Mistral Small 4 in LiteLLM

21.03.2026 · ai-tools

Um die steigenden API-Kosten meiner KI-Workflows zu senken und die Qualität der Outputs zu erhöhen, habe ich mein Setup grundlegend umgebaut. Im Zentrum stehen dabei ein neues LLM-Gateway-Routing und...

Weiterlesen →

n8n Flowletter Templates Evaluation

21.03.2026 · ai-tools

Auf der Suche nach neuen n8n-Templates für meine automatisierte Newsletter-Pipeline stellte ich fest: Fast alle Community-Vorlagen sind extrem generisch und werfen Texten nur ein simples "Fasse das zu...

Weiterlesen →

AEO Next Steps: robots.txt + llms.txt + sitemap.xml

20.03.2026 · ai-tools

Um meinen Blog gezielt für KI-Crawler zu öffnen und gleichzeitig die API-Kosten meiner internen Wissensdatenbank zu senken, habe ich mein technisches Setup in zwei Bereichen grundlegend umgebaut. Stat...

Weiterlesen →

Gemini Batch API Evaluierung fuer Doc-Pipeline

20.03.2026 · ai-tools

Um meine internen Dokumenten-Pipelines kosteneffizienter zu machen und gleichzeitig sicherzustellen, dass meine öffentlichen Inhalte von KI-Systemen korrekt verstanden werden, habe ich mein Setup um A...

Weiterlesen →

Gemini Batch API fuer Doc-Pipeline

20.03.2026 · ai-tools

Bisher habe ich meine Dokumenten-Pipeline für Notizen und Web-Clippings synchron betrieben, was bei steigendem Volumen die Systemressourcen blockierte und hohe API-Kosten verursachte. Um die Ausgaben...

Weiterlesen →

Gemini Spend Caps Evaluierung + Setup

20.03.2026 · ai-tools

Um die API-Kosten meiner automatisierten Wissensextraktion in den Griff zu bekommen und explodierende Rechnungen zu verhindern, habe ich meine Pipeline auf asynchrone Verarbeitung und strikte lokale B...

Weiterlesen →

GPT-5.2 Error Rate Investigation

19.03.2026 · ai-tools

In meinem stetig wachsenden KI-Setup mit zentralem LLM-Gateway fielen mir kürzlich stark erhöhte Fehlerraten bei GPT-5.2-Anfragen auf. Die systematische Analyse offenbarte keine Modell-Aussetzer, sond...

Weiterlesen →

GPT-5.4 Mini/Nano in LiteLLM

19.03.2026 · ai-tools

Um die neuen GPT-5.4 Modelle in meine bestehenden Tools zu integrieren und gleichzeitig die API-Kosten im Griff zu behalten, habe ich mein KI-Setup rund um das LLM-Gateway LiteLLM überarbeitet. Anstat...

Weiterlesen →

Spend-Alert Monatsprognose

19.03.2026 · ai-tools

Um API-Kosten bei der Nutzung eines zentralen LLM-Gateways für Modelle von OpenAI, Anthropic oder Mistral im Blick zu behalten, reichten mir reine Warnungen für Tagesausreißer nicht mehr aus. Deshalb...

Weiterlesen →

KV-Cache Optimierung via MoE-Modelle

19.03.2026 · ai-tools

Mein zentrales LLM-Gateway warf plötzlich Fehler aus und die API-Kosten für die Verarbeitung langer Texte drohten mein Budget zu sprengen. Ich musste mein Setup überarbeiten, um Fehler beim Routing ne...

Weiterlesen →

AEO Schema.org Markup fuer Blog

19.03.2026 · ai-tools

Um sicherzustellen, dass meine Inhalte von KI-gestützten "Answer Engines" wie Perplexity oder ChatGPT richtig verstanden und zitiert werden, habe ich meinen Blog auf AEO (Answer Engine Optimization) u...

Weiterlesen →

Lightpanda Headless-Browser Deployment

17.03.2026 · ai-tools

Um den Ressourcenverbrauch meiner KI-Agenten zu senken und die Qualität der Outputs dauerhaft zu sichern, habe ich mein System umgebaut: Ein extrem schlanker Headless-Browser übernimmt nun das Scrapin...

Weiterlesen →

RL Feedback-Loop: Newsletter-Judge

17.03.2026 · ai-tools

Meine automatisierte Newsletter-Pipeline lieferte zwar korrekte Zusammenfassungen, aber mir fehlte eine Metrik, um den handlungsorientierten Nutzen für meine Arbeit zu messen. Um nicht blind an Prompt...

Weiterlesen →

Prompt-Versionierung + Auto-Optimierung

17.03.2026 · ai-tools

Bisher war Prompt-Optimierung in meinen automatisierten Workflows reiner Blindflug: Manuelles Austauschen von Wörtern, wenn die Qualität der KI-Ausgaben nachließ. Um das systematisch zu lösen, habe ic...

Weiterlesen →

Document Ingestion Pipeline für Vault-Intelligence

17.03.2026 · ai-tools

Bisher waren PDFs, Word-Dokumente und HTML-Dateien für mein persönliches KI-Setup quasi unsichtbar. Um diese Medienbrüche zu beenden, habe ich eine automatisierte Document Ingestion Pipeline gebaut, d...

Weiterlesen →

Claude Code Skills als Ordner-Skills

17.03.2026 · ai-tools

Lange Zeit habe ich meine Workflows für Claude Code als einfache Markdown-Dateien mit Prompts angelegt, bis diese zu komplex und fehleranfällig wurden. Die Lösung lieferte eine simple Erkenntnis eines...

Weiterlesen →

Vault-Intelligence Hybrid-Suche

16.03.2026 · ai-tools

Um meine knapp 6.000 Notizen für meinen KI-Assistenten durchsuchbar zu machen, stieß reine Vektorsuche (RAG) bei spezifischen Fachbegriffen oder IDs schnell an ihre Grenzen. Die Lösung war eine leicht...

Weiterlesen →

LLM-Kosten: Reasoning-Token-Reduktion

16.03.2026 · ai-tools

Bei der Analyse meiner API-Ausgaben fiel mir auf, dass mein automatisiertes KI-Setup unnötig viel Geld verbrannte. Der Grund waren zu viele generierte Tokens durch ausführliche Erklärungen, Höflichkei...

Weiterlesen →

Vault-Intelligence Hybrid-Reranking (RRF)

16.03.2026 · ai-tools

Um meine Wissensdatenbank für RAG (Retrieval-Augmented Generation) verlässlich nutzbar zu machen, stieß die reine semantische Vektorsuche an ihre Grenzen: Sie verstand zwar Konzepte, scheiterte aber a...

Weiterlesen →

OpenClaw Architektur-Review + Poisoning-Defense

16.03.2026 · ai-tools

Mein KI-Agent "OpenClaw" liest autonom Webseiten, überwacht Feeds und fasst externe Daten zusammen. Dabei stieß ich auf ein kritisches Sicherheitsproblem: Was passiert, wenn eine externe Quelle verste...

Weiterlesen →

Metadata-Enrichment bei Vault-Indexierung

16.03.2026 · ai-tools

Mit knapp 6.000 Dokumenten in meinem persönlichen Vault stieß die reine Volltextsuche an ihre Grenzen – eine Suche nach "Prompting" lieferte unstrukturierte Ergebnisse von Lesezeichen bis hin zu Strat...

Weiterlesen →

LiteLLM Prompt Caching Optimierung

14.03.2026 · ai

Um die Kosten und Suchqualität meiner KI-Infrastruktur zu optimieren, habe ich mein Setup auf Architektur- und Infrastrukturebene grundlegend überarbeitet. Der Fokus lag dabei auf effizientem Prompt-C...

Weiterlesen →

Gemini Embedding 2 Upgrade

14.03.2026 · ai

Um die semantische Suchqualität meines RAG-Systems zu verbessern und gleichzeitig die API-Kosten zu senken, habe ich meine KI-Infrastruktur gezielt aktualisiert. Kernstück war der Wechsel auf die "Pre...

Weiterlesen →

Newsletter abonnieren