Die Geschichte hinter HistoriaMP

Ich wollte einfach wissen, was da wirklich steht.

Aus einer persönlichen Frage an historische Quellen wurde eine Pipeline, die nicht einfach lesen will, sondern zeigen muss, wie eine Lesung entsteht.

KI darf helfen. Aber die Quelle entscheidet.

Der Anfang

Nicht als Softwareprojekt. Sondern aus Unzufriedenheit.

HistoriaMP begann nicht mit einem Forschungsantrag, nicht mit einer Arbeitsgruppe und nicht mit dem Plan, eine Plattform zu bauen. Es begann mit einem Interesse an den Templern — und mit dem wachsenden Gefühl, dass ich beim Lesen vieler Darstellungen der eigentlichen Quelle erstaunlich fern blieb.

Man liest viel über Quellen. Aber irgendwann fragt man sich: Wo ist eigentlich der Befund? Wo endet die Handschrift, und wo beginnt Deutung, Glättung oder Übernahme?

Die Frage war nicht kompliziert. Sie war nur hartnäckig: Was steht da wirklich?

Nicht: Was wurde später daraus gemacht? Nicht: Welche moderne Erzählung passt gut dazu? Sondern: Was lässt sich in der konkreten Handschrift tatsächlich sehen, prüfen und begründen?

Der erste KI-Test

Dann habe ich einfach ein Manuskriptbild in eine KI geworfen.

Der erste Schritt war kein ausgearbeiteter technischer Plan. Es war ein Versuch. Ein Manuskriptbild hineinlegen, schauen, was passiert.

Die ersten Ergebnisse waren faszinierend. Die KI erkannte Strukturen, beschrieb Seiten und erzeugte Lesungen, die überraschend plausibel wirkten. Für jemanden ohne großes Forschungsteam, ohne fertigen Trainingskorpus und ohne institutionelle Infrastruktur war das ein Moment echter Öffnung.

Aber genau darin lag auch das Problem.

Die Ernüchterung

Plausibel ist nicht dasselbe wie belegt.

Eine KI kann überzeugend formulieren. Sie kann Lücken schließen, aus Kontext ergänzen, beschädigte Stellen glätten und aus wenigen sichtbaren Spuren einen Text erzeugen, der so gut klingt, dass man fast vergisst, ihn gegen das Bild zu prüfen.

Bei historischen Handschriften ist genau das gefährlich. Ein schöner Text ist noch kein sicherer Text. Eine sprachlich passende Lesung ist noch kein Quellenbefund.

Das Problem war nicht, dass KI nichts konnte. Das Problem war, dass sie oft zu viel konnte — und dabei zu sicher wirkte.

Der Wendepunkt

Aus einem Transkriptionsversuch wurde eine Pipeline.

Der Ablauf „Bild rein, Text raus“ war methodisch zu schwach. Er verdeckte genau den Teil, der bei historischen Quellen entscheidend ist: den Weg vom sichtbaren Befund zur Lesung.

Also änderte sich die Frage. Nicht mehr: Kann die KI das lesen? Sondern: Wie zwinge ich ein System dazu, seine Lesung zu begründen?

Frühe Module dürfen nicht lesen. Sie dürfen nur beobachten. Layout darf nicht mit Bedeutung verwechselt werden. Ein Glyph darf nicht vorschnell zu einem Buchstaben werden. Ein Minimcluster darf nicht automatisch ein Wort ergeben. Die Quelle steht zuerst. Der Text kommt später.

Warum LLM statt nur HTR?

Wer eine Schrift nicht lesen kann, kann sie auch nicht einfach trainieren.

Klassische HTR-Systeme haben ihren Wert. Aber wer eine unbekannte historische Handschrift lesen möchte, steht gerade vor der Schwierigkeit, dass er sie nicht sicher lesen kann. Um ein HTR-System sinnvoll zu trainieren, müsste man aber bereits viele korrekte Beispiele liefern.

Das ist paradox: Man trainiert ein System, damit es die Schrift lesen kann — aber um es zu trainieren, muss man die Schrift schon in erheblichem Maß lesen können.

Deshalb ist der LLM-Weg für HistoriaMP wichtig. Nicht, weil LLMs automatisch recht haben. Sondern weil sie einen Einstieg ermöglichen, bevor ein spezifischer Trainingskorpus existiert — wenn man sie methodisch kontrolliert.

Warum öffentlich?

Das Problem ist nicht nur meines.

HistoriaMP hätte ein privates Werkzeug bleiben können. Aber viele Menschen interessieren sich für historische Dokumente und kommen nicht an sie heran: alte Briefe, Familienquellen, Archivmaterial, kirchliche Dokumente, Chroniken oder digitalisierte Manuskripte.

Nicht jeder hat paläographische Ausbildung. Nicht jeder kann ein HTR-System trainieren. Nicht jeder kann eine technische Pipeline bauen. Trotzdem kann das Interesse echt sein.

Deshalb soll HistoriaMP langfristig als Portal zugänglich werden — nicht als schnelle KI-Spielerei, sondern als ernsthafter Weg zur Quelle.

Die einfache Mitte

Ich wollte wissen, was in einer Quelle steht.

Aus dieser Frage wurde ein Projekt. Aus dem Projekt wurde eine Pipeline. Aus der Pipeline soll ein Portal werden. Und aus dem Portal vielleicht ein Zugang für viele Menschen, die historische Dokumente nicht nur bestaunen, sondern verstehen wollen.

Nicht als Abkürzung an der Wissenschaft vorbei. Sondern als Weg zur Quelle — mit wissenschaftlichem Anspruch, sichtbarer Unsicherheit und überprüfbaren Lesungen.

Pipeline ansehen