Methodik und technische Umsetzung
Die Quelle bleibt der Maßstab. Der Text ist eine Hypothese. Die Evidenz liegt im Bild.
Vom Bildbefund zur überprüfbaren Lesung
Die Seite führt vom methodischen Grundsatz über Analyseebenen und technische Umsetzung bis zu Artefakten, KI-Begrenzung und Qualitätskontrolle.
Die Quelle bleibt der Maßstab
HistoriaMP behandelt historische Handschriften nicht als Bilder, aus denen möglichst schnell Text gewonnen werden soll. Der Text ist nicht der Anfang der Analyse, sondern ihr spätes Ergebnis.
Am Anfang steht die : das , seine Oberfläche, seine Zonen, seine Zeilenstruktur, seine Zeichenformen, seine Beschädigungen, seine Lücken und seine en.
Eine wird bei HistoriaMP nicht einfach behauptet. Sie muss begründet werden.
Der Text ist eine Hypothese. Die Quelle ist die .
HistoriaMP fragt deshalb nicht zuerst: Was steht dort? Sondern zunächst: Was ist im Bild tatsächlich sichtbar? Erst danach folgen Analyse, Transkription, Variantenprüfung, Interpretation und Vermittlung.
Warum diese Trennung notwendig ist
Historische Handschriften sind keine normalen Textbilder. Sie enthalten beschädigte Zeichen, uneindeutige Strichgruppen, Abkürzungen, spätere Zusätze, Randzeichen, Farbwechsel, Korrekturen, Materialspuren und Bereiche, deren Funktion nicht sofort bestimmbar ist.
Klassische - oder -Systeme arbeiten häufig auf ein glattes Ergebnis hin: Bild → Text.
HistoriaMP arbeitet anders: Bild → Befund → Struktur → Segment → Zeile → Glyph → Minimcluster → Abbreviatur → Lesung → Konsens → Qualitätskontrolle.
Das Ziel ist nicht die schnellste Transkription. Das Ziel ist eine Lesung, deren Entstehung überprüfbar bleibt. Eine glatte Antwort kann wissenschaftlich problematisch sein, wenn nicht mehr sichtbar ist, welche Stelle sicher gelesen wurde, welche Stelle unsicher war und welche Entscheidung auf Interpretation beruht.
Unsicherheit ist kein Fehler. Sie ist ein Ergebnis.
Vom Befund zur Lesung
HistoriaMP trennt die Arbeit an einer Handschrift in fünf Ebenen. Diese Ebenen dürfen sich nicht vermischen.
01 Beobachtung
Auf dieser Ebene wird nur beschrieben, was im Bild sichtbar ist: Schreibbereiche, Zeilenstrukturen, Randbereiche, Farbunterschiede, Beschädigungen, isolierte Zeichenformen, dichte Strichgruppen, schwache Bereiche und mögliche ierungsrisiken.
In dieser Ebene wird nicht gelesen. Eine rote Form ist zunächst nur eine rote Form. Ein größerer Zeichenbereich ist zunächst nur ein größerer sichtbarer Formbereich. Ein Randzeichen ist zunächst nur ein isolierter sichtbarer Randbefund.
02 Analyse
In der Analyse werden sichtbare Strukturen geordnet: Bereiche, Zonen, Zeilenverläufe, randnahe Formen, mögliche Schnittstellenrisiken und kritische Zeichenbereiche.
Auch hier gilt: Analyse ist noch keine Transkription. Eine Zone ist nicht automatisch ein Haupttext, ein farblich abweichender Bereich nicht automatisch eine Rubrik und eine größere Form nicht automatisch eine Initiale.
03 Transkription
Erst wenn ein sichtbarer ausreichend dokumentiert ist, kann eine Lesung vorgeschlagen werden. Sie bleibt an Bildausschnitt, Koordinaten, Glyphbefunde, erkannte Unsicherheiten, Varianten und frühere Analyseartefakte gebunden.
Eine soll den Befund möglichst quellennahe wiedergeben. Wenn ein Zeichen unklar ist, muss die Unsicherheit sichtbar bleiben. Wenn ein mehrere Lesungen zulässt, darf daraus nicht automatisch ein glattes Wort entstehen.
04 Interpretation
Interpretation beginnt erst nach der quellengebundenen Lesung. Sie fragt nach Bedeutung, sprachlicher Einordnung, Varianten, offenen Stellen und editorischen Entscheidungen.
Diese Ebene darf den Befund nicht rückwirkend verändern. Eine sprachlich plausible Ergänzung ist kein sichtbarer Beweis; eine historische Erwartung ersetzt keine Quelle.
05 Vermittlung
Die letzte Ebene ist die verständliche Darstellung für heutige Leser. Hier kann ein Text erklärt, übersetzt oder eingeordnet werden. Diese Darstellung darf lesbarer sein als die diplomatische Transkription, muss aber als Darstellung erkennbar bleiben.
- Befundnahe Analyse: Was ist sichtbar?
- Diplomatische oder kritische Lesung: Was lässt sich aus dem Befund lesen?
- Lesbare Erklärung oder Übersetzung: Wie kann man den Inhalt heute verstehen?
Technische Umsetzung
HistoriaMP ist als modulare Forschungsumgebung angelegt. Die technische Umsetzung folgt nicht dem Muster eines klassischen OCR- oder HTR-Systems, bei dem ein Bild direkt in Text umgewandelt wird.
Nicht ein Modell erzeugt einfach Text. Eine erzeugt nachvollziehbare Analyseartefakte, aus denen später eine begründete Lesung entstehen kann.
Infrastruktur und Run-System
HistoriaMP unterscheidet zwischen Infrastruktur und wissenschaftlicher Analysepipeline. Die Infrastruktur übernimmt Bildannahme, Dateiprüfung, Speicherung, -Erzeugung, -Erzeugung, Segmentierung, Koordinatenverwaltung und Artefaktspeicherung.
Sie entscheidet jedoch nicht, was in einer Handschrift steht: Sie liest nicht, transkribiert nicht und interpretiert nicht. Ihre Aufgabe ist eine stabile, reproduzierbare und prüfbare Arbeitsgrundlage.
Ein Run dokumentiert den konkreten Analysevorgang. Er kann Ausgangsbild, technische Bilddaten, Hashwerte, Segmente, Koordinaten, s, Modulresultate, Zwischenartefakte, Prüfberichte sowie spätere Lesungs- oder Variantenstände enthalten.
Damit soll nachvollziehbar bleiben, welches Bild verwendet wurde, welche Bildfassung analysiert wurde, welches Modul welche Aussage erzeugt hat und welche Unsicherheit markiert wurde.
Bildintegrität und Koordinatenräume
Vor jeder inhaltlichen Analyse steht die technische Prüfung der Bildquelle. Ein digitales Bild ist nicht automatisch eine neutrale Quelle, denn zwischen Manuskript und Modellinput können Upload, Skalierung, Komprimierung, Formatumwandlung, Cropping, Padding, Segmentierung oder Modellvorverarbeitung liegen.
Deshalb wird die Bildfassung selbst zum . HistoriaMP soll Dateiformat, Bildmaße, Dateigröße, Hashwert, Farbraum, Metadaten, abgeleitete Bildfassungen, Segmente, Crops, Modellinput-Fassungen und die Transformationskette zwischen Ausgangsbild und Analysebild erfassen.
Eine Modellaussage gilt zunächst nur für die konkrete Bildfassung, die dem Modell tatsächlich vorlag. Sie ist nicht automatisch ein Befund am Originalbild.
Keine Koordinate ohne .
Eine Markierung an einer x- und y-Position ist nur aussagekräftig, wenn klar ist, auf welches Bild sie sich bezieht: Ausgangsbild, Segment, Crop, Modellinput oder Prozentkoordinaten relativ zu einer bestimmten Bildfassung.
Wenn ein Bild skaliert, zugeschnitten oder gepaddet wurde, entsteht ein neuer Bildraum. Jeder Befund muss deshalb angeben, zu welchem Bildartefakt er gehört, welche Maße dieses Artefakt hatte, wie es abgeleitet wurde und ob eine Rückführung auf das Ausgangsbild möglich ist.
Konservative Segmentierung
HistoriaMP vermeidet es, bereits am Anfang zu entscheiden, welche Bildbereiche wichtig oder unwichtig sind. Auch scheinbar leere Bereiche können schwache Spuren, Rasuren, Durchdrücke, Randzeichen, spätere Zusätze, Flecken, Materialveränderungen oder beschädigte Formen enthalten.
Die technische Segmentierung soll Informationsverlust verhindern. Segmente werden so erzeugt, dass sie die Bildfläche vollständig abdecken. Überlappende Segmente helfen, Zeichenformen nicht an Segmentgrenzen abzuschneiden.
Segmentierung schützt den Befund. Sie entscheidet ihn nicht.
Die Segmentdaten enthalten Koordinaten, Größenangaben und Verweise auf die jeweilige Bildposition. Dadurch kann jeder spätere Modulbefund wieder auf einen konkreten Ausschnitt zurückgeführt werden.
Module und Artefakte
HistoriaMP arbeitet mit spezialisierten Analysemodulen statt mit einem Einheitsmodell. Die Pipeline kann in vereinfachter Form so beschrieben werden:
Bildintegrität → Layout → Segment → Zeile → Glyph → Minimcluster → Abbreviatur → Transkription → Konsens → Qualitätskontrolle
Jedes Modul hat eine begrenzte Aufgabe. Ein frühes Quellenmodul darf nur sichtbare Bildmerkmale beschreiben; spätere Module können Layout, Zeichenformen, Strichcluster, Abkürzungsbefunde, Transkriptionsvorschläge oder Qualitätsprüfungen bearbeiten.
Wenn ein Sprach- oder Bildmodell verwendet wird, muss seine Aussage an ein konkretes Eingabeartefakt gebunden sein: Bild oder Segment, Inputmaße, mögliche Skalierung oder Komprimierung, Hash, Ausgangsbild und Koordinatenraum.
Das prinzip ist der Kern der Methode. Gespeichert werden nicht nur Ergebnisse, sondern auch Bild- und Eingabedaten, Segmentkoordinaten, Layoutbefunde, Zeilenstrukturen, Glyphbefunde, Minimcluster, Abkürzungsbefunde, Variantenlisten, Unsicherheitsberichte, Transkriptionsvorschläge und Qualitätsprüfungen.
Eine spätere Nutzerin oder ein späterer Nutzer soll nicht nur sehen: Hier steht dieser Text. Sondern auch: Warum wurde diese Stelle so gelesen? Auf welchen sichtbaren Befund stützt sich die Lesung? Wo ist sie sicher? Wo bleibt sie offen?
Glyphen, Minimcluster und Abkürzungen
Eine zentrale Schwierigkeit historischer Handschriften liegt auf der Ebene der Zeichenformen. Ein ist in der frühen Analyse noch kein sicherer Buchstabe. Ein Strichcluster ist noch kein Wort. Eine ist noch keine aufgelöste Lesung.
Kritisch sind vor allem Minimcluster, über- oder unterzeilige Zeichen, isolierte Punkte, Kürzungsstriche, Ligaturen, beschädigte Glyphen, eng verbundene Formen, Farbwechsel, randnahe Zeichen und unklare Zusatzformen.
HistoriaMP kann solche Stellen als visuelle Befundartefakte markieren, bevor eine Lesung erzeugt wird. Diese Ebene fragt nicht: Was steht dort? Sondern: Wo gibt es im Bild eine visuelle Form, die für eine spätere Lesung kritisch sein könnte?
Solche Befunde können mit Koordinaten, Segmentbezug, Bildhash und Unsicherheitsstatus gespeichert werden. Erst danach kann geprüft werden, ob die Stelle lesbar ist, ob mehrere Lesungen möglich sind oder ob sie offenbleiben muss.
Kandidaten sind keine Lesungen
Für besondere Zeichen, Abkürzungen oder historische Glyphformen können Referenzräume wie Unicode, MUFI oder interne Glyphregister wichtig werden. Sie sind jedoch keine automatische Entscheidung.
Ein Kandidat ist keine Lesung. Ein Codepoint ist kein Beweis. Ein Fontzeichen ist kein Manuskriptbefund.
Die technische Reihenfolge bleibt: sichtbarer Befund → interne Glyphbeschreibung → Kandidatenraum → Prüfung → Entscheidung → Transkription. Die finale Entscheidung benötigt eine sichtbare Grundlage und gegebenenfalls .
KI unter Kontrolle
KI-Modelle können historische Manuskriptbilder beschreiben, Strukturen erkennen, Transkriptionsvorschläge machen und Texte erklären. Für eine Primärquelle ist diese Stärke zugleich ein Risiko: Ein Modell ergänzt Muster, ordnet Unklares, formuliert plausibel und erzeugt flüssige Antworten.
Bei historischen Handschriften kann dadurch entstehen: Ein unklarer Strich wird zu einem Buchstaben, ein beschädigter Bereich zu einem Wort, ein Minimcluster zu einer glatten Lesung oder eine Lücke durch sprachliche Erwartung geschlossen.
HistoriaMP begrenzt KI deshalb bewusst. Frühe Module dürfen nicht lesen, nicht transkribieren, keine Funktion behaupten, keine Bedeutung interpretieren und keine beschädigten Stellen ergänzen. Sie sollen beobachten, beschreiben und Unsicherheit markieren.
Der ist dabei kein Selbstzweck. Er ist eine methodische Bremse: Er legt fest, was ein Modell tun soll, aber auch, was es in diesem Arbeitsschritt noch nicht behaupten darf.
Ein Prompt allein macht noch keine wissenschaftliche Methode. Methode entsteht erst durch klare Modulrollen, geeignete Modellwahl, dokumentierte Bildfassungen, versionierte Arbeitsanweisungen, kontrollierte Ausgabeformate, gespeicherte Artefakte, , menschliche Prüfung und Qualitätskontrolle.
Für HistoriaMP ist nicht immer das Modell am besten, das am meisten erkennt. Oft ist das bessere Modell jenes, das zuverlässig sagen kann: Hier reicht der Befund nicht aus.
Was die Methode verhindern soll
HistoriaMP ist ein Schutzsystem gegen Scheinpräzision. Es soll verhindern, dass glatter Text ohne ausreichenden sichtbaren Befund entsteht, unsichere Stellen still geglättet werden oder Farbe, Größe und Position vorschnell als Funktion gedeutet werden.
Ebenso soll verhindert werden, dass Modelle sprachlich, historisch oder editorisch Erwartbares ergänzen, kleine Randzeichen oder schwache Spuren durch Segmentierung verloren gehen, Befunde in falsche Bildräume übertragen werden oder Aussagen über reduzierte Modellbilder ungeprüft als Aussagen über das Originalbild gelten.
Qualitätskontrolle und menschliche Prüfung
Am Ende der Pipeline steht nicht nur die Ausgabe einer Lesung, sondern ein Vergleich der Analyseebenen.
Die Qualitätskontrolle kann prüfen, ob eine kritische Glyphstelle im späteren Text berücksichtigt wurde, ob eine sichtbare Abkürzungsform still expandiert wurde, ob ein unsicherer Minimcluster zu sicher gelesen wurde, ob Koordinaten und Modellinput dokumentiert sind und ob Unsicherheiten korrekt übernommen wurden.
Wenn ein Befund nicht ausreichend abgesichert ist, kann die Lesung markiert, zurückgestellt oder blockiert werden. Nicht jede Stelle muss entschieden werden. Manchmal ist die wissenschaftlich sauberste Antwort: Der Befund reicht für eine sichere Lesung nicht aus.
HistoriaMP ist nicht als vollautomatische Wahrheitsmaschine konzipiert. Die Pipeline kann Befunde markieren, Lesungen vorschlagen, Varianten vergleichen und Risiken sichtbar machen. Die wissenschaftliche Bewertung bleibt jedoch eine prüfende Aufgabe.
Die technische Umsetzung dient deshalb nicht der Ersetzung quellenkritischer Arbeit, sondern ihrer Strukturierung.
Drei Darstellungsebenen für Nutzer
HistoriaMP soll sowohl für wissenschaftliche Arbeit als auch für interessierte Nutzer verständlich sein. Deshalb braucht die Plattform mehrere Darstellungsebenen.
- Befundebene: zeigt Bildausschnitt, Koordinaten, Segment, Glyphbefund, Unsicherheit und Varianten. Sie bleibt streng am sichtbaren Befund.
- Leseebene: zeigt eine diplomatische oder kritische Lesung. Sie kann Abkürzungen, Varianten und Unsicherheiten sichtbar machen, bleibt aber an die Analyse gebunden.
- Erklärungsebene: vermittelt den Inhalt für heutige Leser. Sie kann übersetzen, erklären und einordnen, darf aber die Befundebene nicht ersetzen.
Zusammenfassung
HistoriaMP setzt seine Methodik durch eine modulare, artefaktbasierte Pipeline um. Bildfassungen werden dokumentiert, Koordinaten bleiben rückführbar, Segmente werden konservativ erzeugt, Modelle arbeiten innerhalb definierter Rollen, glyphische Risiken werden markiert und Lesungen bleiben an sichtbare Evidenz gebunden.
Damit entsteht keine klassische OCR-Ausgabe, sondern eine dokumentierte Kette vom digitalen Bildbefund zur begründeten Lesung. Wo der Befund klar ist, kann eine Lesung begründet werden. Wo der Befund unsicher ist, bleibt die Unsicherheit sichtbar. Wo die Quelle nicht genug hergibt, darf das System nicht mehr behaupten.
HistoriaMP erzeugt keine historische Wahrheit.
HistoriaMP dokumentiert den Weg vom sichtbaren Befund zur überprüfbaren Lesung.
Die Quelle bleibt der Maßstab. Der Text ist eine Hypothese. Die Evidenz liegt im Bild.
