Feature: KI-Prompt bei Zeichenlimit-Ueberschreitung automatisch kuerzen #42

Closed
opened 2026-04-27 11:06:00 +02:00 by marcus · 1 comment
Owner

Problem

Wenn der KI-Vorschlag das konfigurierte Zeichenlimit ueberschreitet, scheitert die Verarbeitung hart mit einem 'deterministic content error'. Das Dokument landet in FAILED_FINAL.

Konkretes Beispiel

Limit: 50 Zeichen
KI-Vorschlag: 'Collegium Augustinum Gehaltsmitteilung November 2022' (52 Zeichen)
Ergebnis: FAILED_RETRYABLE -> FAILED_FINAL

Dabei waere eine minimale Kuerzung trivial:

  • 'November 2022' -> 'Nov. 2022' oder '11-2022'
  • Ergebnis: 49 Zeichen, valide

Gewuenschtes Verhalten

Die KI bekommt im Prompt explizit die Anweisung, bei Bedarf sinnvoll zu kuerzen (Abkuerzungen, kompaktere Datumsformate), anstatt einen zu langen Vorschlag zu liefern. Das Zeichenlimit ist Benutzersache und soll eingehalten werden – aber die KI soll intelligent damit umgehen.

Akzeptanzkriterien

  1. Prompt enthaelt explizite Kuerzeungsregel bei Zeichenlimit-Naehe
  2. KI liefert validen Dateinamen innerhalb des Limits
  3. Fallback: Wenn KI trotzdem zu lang liefert, greift weiterhin die bestehende Validierung
  4. Kein neuer Fehlertyp – bestehende Validierung bleibt als Sicherheitsnetz
## Problem Wenn der KI-Vorschlag das konfigurierte Zeichenlimit ueberschreitet, scheitert die Verarbeitung hart mit einem 'deterministic content error'. Das Dokument landet in FAILED_FINAL. ## Konkretes Beispiel Limit: 50 Zeichen KI-Vorschlag: 'Collegium Augustinum Gehaltsmitteilung November 2022' (52 Zeichen) Ergebnis: FAILED_RETRYABLE -> FAILED_FINAL Dabei waere eine minimale Kuerzung trivial: - 'November 2022' -> 'Nov. 2022' oder '11-2022' - Ergebnis: 49 Zeichen, valide ## Gewuenschtes Verhalten Die KI bekommt im Prompt explizit die Anweisung, bei Bedarf sinnvoll zu kuerzen (Abkuerzungen, kompaktere Datumsformate), anstatt einen zu langen Vorschlag zu liefern. Das Zeichenlimit ist Benutzersache und soll eingehalten werden – aber die KI soll intelligent damit umgehen. ## Akzeptanzkriterien 1. Prompt enthaelt explizite Kuerzeungsregel bei Zeichenlimit-Naehe 2. KI liefert validen Dateinamen innerhalb des Limits 3. Fallback: Wenn KI trotzdem zu lang liefert, greift weiterhin die bestehende Validierung 4. Kein neuer Fehlertyp – bestehende Validierung bleibt als Sicherheitsnetz
Author
Owner

Produkttest-Befund: Problem modellabhängig

Der Prompt wurde durch Opus 4.7 bereits optimal erweitert – mit expliziten Kürzungsanweisungen, Beispielen und der Aussage 'Liefere IMMER einen Titel, der das Zeichenlimit einhält.'

Trotzdem liefert das Modell gpt-4o-mini weiterhin zu lange Titel:

KI-Vorschlag abgelehnt: 'Internationale Fachhochschule Diplomprüfung Hotelmanagement'
ist zu lang (59 Zeichen, Limit: 50)

Ursache

gpt-4o-mini ist ein kleines, kostengünstiges Modell das Zeichenbegrenzungen nicht zuverlässig einhält. Das ist ein bekanntes Verhalten kleiner Modelle bei präzisen Längenvorgaben.

Bewertung

  • Der Prompt ist nicht das Problem – er ist optimal formuliert
  • Die Validierung als Sicherheitsnetz funktioniert korrekt
  • Der Benutzer erhält eine verständliche Fehlermeldung mit dem abgelehnten Vorschlag
  • Manuelles Kürzen ist als Fallback möglich (#31 implementiert)

Empfehlung

Mit leistungsfähigeren Modellen (Claude Sonnet, GPT-4o) tritt das Problem deutlich seltener auf. Das Issue wird als 'modellabhängig, nicht vollständig auf Prompt-Ebene lösbar' dokumentiert und bleibt offen für eine spätere Betrachtung im Kontext der Modellwahl.

## Produkttest-Befund: Problem modellabhängig Der Prompt wurde durch Opus 4.7 bereits optimal erweitert – mit expliziten Kürzungsanweisungen, Beispielen und der Aussage 'Liefere IMMER einen Titel, der das Zeichenlimit einhält.' Trotzdem liefert das Modell **gpt-4o-mini** weiterhin zu lange Titel: ``` KI-Vorschlag abgelehnt: 'Internationale Fachhochschule Diplomprüfung Hotelmanagement' ist zu lang (59 Zeichen, Limit: 50) ``` ## Ursache gpt-4o-mini ist ein kleines, kostengünstiges Modell das Zeichenbegrenzungen nicht zuverlässig einhält. Das ist ein bekanntes Verhalten kleiner Modelle bei präzisen Längenvorgaben. ## Bewertung - Der Prompt ist nicht das Problem – er ist optimal formuliert - Die Validierung als Sicherheitsnetz funktioniert korrekt - Der Benutzer erhält eine verständliche Fehlermeldung mit dem abgelehnten Vorschlag - Manuelles Kürzen ist als Fallback möglich (#31 implementiert) ## Empfehlung Mit leistungsfähigeren Modellen (Claude Sonnet, GPT-4o) tritt das Problem deutlich seltener auf. Das Issue wird als 'modellabhängig, nicht vollständig auf Prompt-Ebene lösbar' dokumentiert und bleibt offen für eine spätere Betrachtung im Kontext der Modellwahl.
Sign in to join this conversation.
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: marcus/pdf-umbenenner#42