Files

Marcus van Elst 91b7a918c7 M1-Fix: Exit-Code für ungültige Konfiguration auf 1 geändert

2026-03-31 16:00:37 +02:00

3.9 KiB

Raw Blame History

Fachliche Anforderungen – PDF-Umbenenner

1. Zielbild

Das System verarbeitet PDF-Dateien aus einem definierten Quellordner und erzeugt daraus eindeutig benannte, verständliche Zieldateien.

Ziel ist eine automatisierte, nachvollziehbare, robuste und wiederholbare Benennung von Dokumenten für den produktiven Einsatz.

2. Geltungsbereich

Dieses Dokument beschreibt ausschließlich die fachlichen Anforderungen.

Nicht enthalten:

technische Architektur
Framework-Entscheidungen
Implementierungsdetails

3. Hauptprozess

Eine PDF-Datei im Quellordner wird als Verarbeitungskandidat erkannt.
Die Datei wird verarbeitet.
Falls erfolgreich:
- Ein neuer Dateiname wird erzeugt.
- Die Datei wird im Zielordner abgelegt.
Falls fehlgeschlagen:
- Der Fehler wird dokumentiert.
- Ein Retry erfolgt abhängig von der Fehlerart.

4. Benennungsregeln

4.1 Format

Der Dateiname folgt strikt diesem Muster:

YYYY-MM-DD - Titel.pdf

4.2 Datum

Priorität:

Rechnungsdatum
Dokumentdatum
anderes sinnvolles Dokumentdatum
aktuelles Datum (Fallback)

Definition „anderes sinnvolles Dokumentdatum“

Reihenfolge:

Ausstellungsdatum
Bescheiddatum
Schreibdatum
Ende eines Leistungszeitraums

Fallback auf aktuelles Datum ist erlaubt, wenn kein belastbares Datum eindeutig ableitbar ist.

4.3 Titel

maximal 20 Zeichen (Basistitel)
verständlich und eindeutig
keine Sonderzeichen außer Leerzeichen

4.4 Sprache

Titel werden auf Deutsch erzeugt
Eigennamen bleiben unverändert

4.5 Dublettenregel

Bei Namenskonflikten:

(1), (2), … wird angehängt

Regel:

20 Zeichen gelten nur für den Basistitel
Suffix wird zusätzlich ergänzt

5. Verarbeitungsfähigkeit

Jede PDF im Quellordner ist zunächst ein Verarbeitungskandidat
Die fachliche Bewertung erfolgt während der Verarbeitung

6. Fehlerbehandlung

6.1 Fehlerarten

Deterministische Inhaltsfehler

kein extrahierbarer Text
Seitenlimit überschritten
nicht eindeutig interpretierbar

Transiente Fehler

KI nicht erreichbar
Timeout
technische Fehler

6.2 Retry-Logik

Inhaltsfehler: genau 1 Retry
danach finaler Fehler
Transiente Fehler: Retry bis Maximalwert

7. KI-Nutzung

KI wird zur Ermittlung von Datum und Titel verwendet

Begründung

Bei KI-Aufruf: KI-Begründung erforderlich
Ohne KI-Aufruf: fachliche/systemische Begründung erforderlich

8. Mehrdeutigkeit

Wenn ein Dokument nicht eindeutig interpretierbar ist:

Verarbeitung wird als Fehler bewertet
kein unsicheres Ergebnis wird erzeugt

9. Idempotenz

Erfolgreiche Dateien werden nicht erneut verarbeitet
Retryable fehlgeschlagene Dateien können in späteren Läufen erneut verarbeitet werden
Final fehlgeschlagene Dateien werden in späteren Läufen übersprungen

10. Umgang mit Quelldateien

Quelldateien bleiben unverändert
keine Überschreibung

11. Identifikation

nicht über Dateinamen