Grenzen & offene Probleme

HistoriaMP tut nicht so, als könne KI alles.

Diese Seite wird gezielt die Probleme dokumentieren, die bei LLM-gestützter Handschriftenanalyse real sind — und wie HistoriaMP damit umgeht.

Warum diese Seite?

Die Probleme sind Teil der Methode.

HistoriaMP basiert nicht auf dem Glauben, dass LLMs historische Handschriften einfach zuverlässig lesen können. Im Gegenteil: Viele zentrale Architekturentscheidungen entstanden, weil diese Systeme reale Grenzen haben.

Wer sich mit dem Thema auskennt, soll hier sehen: Die Probleme sind nicht übersehen worden. Sie sind der Grund, warum die Pipeline so vorsichtig gebaut wird.

Digitale Vorverarbeitung ist nie neutral

Der Xerox-Fall zeigt, warum der Entstehungsweg zählt.

2013 zeigte David Kriesel an Xerox-Scankopierern, dass digitale Dokumente sauber aussehen und trotzdem falsch sein können: Unter bestimmten Bedingungen wurden Zahlen und Bildfragmente in Scans vertauscht. Entscheidend ist der methodische Punkt: Der Fehler entstand nicht erst durch OCR, sondern in den Bilddaten selbst.

Für HistoriaMP ist das eine wichtige Erinnerung. Auch bei Handschriften darf ein digitaler Output nicht mit der Quelle verwechselt werden. Scans, Kompression, Segmentierung, OCR, HTR und KI-Ausgaben sind Verarbeitungsschritte. Sie können helfen, aber sie können auch verändern, verdecken oder scheinbare Sicherheit erzeugen.

Darum dokumentiert HistoriaMP nicht nur Ergebnisse, sondern den Weg dorthin.

Wird ausgearbeitet

Themen, die hier dokumentiert werden

Bildauflösung & Downsampling

Warum interne Bildverkleinerung bei Primärquellen problematisch ist.

Glyphen & Zeichen

Warum ein sichtbarer Strich nicht automatisch ein moderner Buchstabe ist.

Minimcluster

Warum dichte Strichgruppen besonders anfällig für Scheinpräzision sind.

Abbreviaturen

Warum sichtbares Kürzungszeichen und editorische Auflösung getrennt bleiben müssen.

Unicode & Schriftkodierung

Warum nicht jedes historische Zeichen stabil als moderner Zeichensatz abbildbar ist.

Phantomlesungen

Warum plausible, aber visuell nicht getragene Lesungen blockiert werden müssen.

Vorläufige Haltung

Die Lösung ist nicht Vertrauen, sondern Kontrolle.

HistoriaMP begegnet diesen Problemen mit Segmentierung, Visual-Basis-Referenzen, Unsicherheitsmarkierung, getrennten Artefakten, Review-Schritten, Validatoren und Qualitätskontrolle.

Diese Seite wird später ausführlich beschreiben, welche Hürden aktuell bestehen, welche Lösungsansätze getestet werden und wo bewusst keine Sicherheit behauptet wird.