MTK & HCCH   |   Onlinepublikation
5300 Jahre Schrift
Universität Heidelberg: Sonderforschungsbereich 933 der Deutschen Forschungsgemeinschaft.
Materiale Textkulturen. Materialität und Präsenz des Geschriebenen in non-typographischen Gesellschaften
& Heidelberg Center for Cultural Heritage – HCCH
MTK & HCCH | Onlinepublikation | 5300 Jahre Schrift
Sonderforschungsbereich 933 der Deutschen Forschungsgemeinschaft. Materiale Textkulturen & Heidelberg Center for Cultural Heritage – HCCH
 

Tontafeln in Vektorräumen

Algorithmen für Schrift in 3D (2012)

von Hubert Mara  (Informatik)

 
Querschnitt durch eine dreidimensional erfasste Keilschrifttafel

Die annähernd rechtwinkligen Abdrücke des Stylus sind deutlich zu sehen. Daraus ergeben sich die Volumina für die Kugeln, die im Bereich der Keile in etwa ¾ der Sphären füllen. Jede — in unterschiedlichen Farben gezeigte — Kugelgröße entspricht einer Dimension in den beispielhaft gezeigten höherdimensionalen Merkmalsvektoren. Diese bilden einen Vektorraum zur Berechnung von kontrastreichen Abbildungen und Extraktion von Zeichen mit dem ›Giga­Mesh-Software-Framework‹.

 
Untersucht wurden unter anderem Tontafeln aus dem Vorderasiatischen Museum Berlin, der Sammlung des Seminars für Sprachen und Kulturen des Vorderen Orients (Assyriologie) der Universität Heidelberg und der in Heidelberg aufbewahrten Uruk-Warka-Sammlung des Deutschen Archäologischen Instituts, 2012.
zum Autor

Hubert Mara ist Informatiker und Nachwuchsgruppenleiter des »Forensic Computational Geometry Laboratory« am Interdisziplinären Zentrum für Wissenschaftliches Rechnen (IWR) der Universität Heidelberg. Mittels computergestützter Methoden macht diese Forschungsgruppe Zeugnisse der Vergangenheit auf Artefakten wieder sichtbar und lesbar und legt so auch die Grundlage für automatisierte Auswertungsverfahren.

 

Artikel als PDF

Das geschriebene Wort wird meistens nur zweidimensional — als dunkle Linien auf einem hellen Hintergrund — wahrgenommen, wie man dies von Tinte auf Papier gewohnt ist. Während Tinte bereits 3000 Jahre vor unserer Zeitrechnung in Ägypten verwendet wurde, entstanden in den benachbarten Reichen im Nahen Osten verschiedene Schriftsysteme, die Tontafeln als Schreibmaterial genutzt haben. Anstelle von Tinte wurden mit einem eckigen Stylus keilförmige Eindrücke in den feuchten Ton gesetzt. Gruppen von Keileindrücken bilden die Keilschriftzeichen, die von zahlreichen Völkern über mehr als drei Jahrtausende genutzt wurden. Dies bedeutete gleichzeitig, dass Keilschrift zum Schreiben von verschiedensten Sprachen genutzt wurde. Um Keilschrifttafeln lesen zu können, benötigt man zusätzlich zu umfangreichen Sprachkenntnissen eine entsprechende Beleuchtung, da die Zeichen nur als Hell-Dunkel-Kontrast lesbar sind. Diese Beleuchtung ist im Vorderen Orient in Form von hartem Sonnenlicht ausreichend verfügbar. Da die Tontafeln meistens von Hand geformt wurden, sind deren Oberflächen typischerweise leicht gekrümmt. Daher müssen die Tafeln beim Lesen immer wieder neu ausgerichtet werden, um die dafür notwendigen Schlagschatten in den Keilen zu erzeugen.

Heutzutage werden Keilschrifttafeln weltweit verteilt in vielen Museen und Sammlungen aufbewahrt, in denen man oft nur wenig Zeit und Licht findet, um Umschriften oder -zeichnungen von den Originalen anzufertigen. Bei einem geschätzten Gesamtumfang von mindestens 500.000 an weltweit bekannten Tafeln bedeutet deren Autopsie vor Ort einen enormen Bedarf an Zeit und Reisemitteln. Daher ist die Altorientalistik (Assyriologie) stetig bemüht, eine möglichst rasche und genaue Dokumentation zu erreichen. Dabei wurden und werden unterschiedliche Techniken eingesetzt. Die Photographie und der Flachbettscanner stellen die günstigsten und schnellsten Verfahren dar, die je nach Qualität und Erhaltungszustand der Tafeln — im wahrsten Sinne des Wortes — die Keile im Schatten stehen lassen. Abgüsse aus Gips, chemische Verfahren sowie Holographie liefern ebenfalls beachtenswerte Ergebnisse, die allerdings zu einem hohen Preis erkauft werden müssen. Aufgrund des Fortschritts der digitalen Photographie ergab sich in den letzten Jahren mit den neuen Methoden der optischen Messtechnik die Möglichkeit, sehr genaue 3D-Vermessungen von Oberflächen durchzuführen. Zu den drei gängigsten Verfahren zählt die Kombination von strukturiertem Licht und stereoskopischem Sehen, das ›Reflectance Transformation Imaging‹ (RTI) und ›Structure from Motion‹ (SfM), das aus der Photogrammetrie hervorgegangen ist. Alle diese Verfahren ermöglichen das dreidimensionale Erfassen von kleinsten geometrischen Strukturen in der Größenordnung von 10 bis 20 µm. Aus den Serien von Rasterbildern dieser 3D-Scanner wird aus mehreren Bildpunkten ein dreidimensionaler Messpunkt (Vertex) berechnet und mit seinen nächsten Nachbarn zu einem Dreiecksgitter vernetzt. Bei Objekten in der Größe von Keilschrifttafeln wird deren Oberfläche typischerweise mit 5 bis 15 Millionen Vertices und in etwa doppelt so vielen Dreiecken beschrieben. Aus dem Bereich der Computergraphik (CG) steht eine Vielzahl an Darstellungsmöglichkeiten von 3D-Modellen zur Verfügung, die allerdings meistens auf globalen Methoden und/oder starken Vereinfachungen der Oberflächengeometrie basieren. Mit virtuellen Lichtquellen kann man eine Tafel beinahe so detailliert untersuchen wie das Original, während andere CG-Methoden keine ausreichend genaue Darstellung bieten. Daher verwenden wir lokale Filtermethoden, wie sie aus dem Bereich der Bildverarbeitung und Mustererkennung bekannt sind. Filter wie der bekannte Canny-Algorithmus bestimmen in einer kleinen Nachbarschaft den maximalen Anstieg (Gradient) eines Grauwertbildes und verfolgt diesen, um Linienzüge (Kanten) zu extrahieren.

Dieses Prinzip lässt sich auf die Dreiecksgitter der vermessenen Keilschrifttafeln adaptieren, indem die Krümmung der Oberfläche (Mannigfaltigkeit) für jeden Vertex berechnet wird. Dafür eignen sich insbesondere die sogenannten ›Integral Invarianten‹, bei denen Kugeln mit dem 3D-Modell geschnitten werden. Dabei wird in jedem Punkt der diskreten Mannigfaltigkeit eine Kugel positioniert sowie Schnittvolumen und -fläche berechnet. Beide Werte sind Näherungen für die gauß'sche und die mittlere Krümmung. Die ermittelten Werte sind durch die Punktsymmetrie der Kugel invariant gegen Rotation und Verschiebung (Translation). Die Schnittfläche berechnet sich aus der Summe (numerische Integration) der Dreiecksflächen. Die Dreiecke innerhalb der Kugel werden gleichzeitig als Deckflächen von Prismen genutzt, um das Schnittvolumen numerisch zu bestimmen. Der Radius der Kugeln ist de facto die Filterbreite und muss daher der Größenordnung der Keile, also des gesuchten Merkmals entsprechen. Da Merkmale in ihrer Größe variieren können, werden typischerweise verschiedene Radien verwendet, um eine Invarianz gegen Skalierung zu erreichen. Das gesamte Verfahren ist daher ein ›Mehr-Skalen Integral Invarianter‹ (MSII) Filter, der einer der grundlegenden Algorithmen im ›GigaMesh Software Framework‹ ist. Basierend auf dem MSII Filter werden Schriftzeichen in 3D im ersten Schritt mit maximalem Kontrast dargestellt. Im zweiten Schritt werden die Umrisslinien und Skelettlinien (Mittellinien) der Schriftzeichen entlang der Eindrücke der Oberfläche bestimmt. Diese Polygonzüge werden in der ›eXtensible Markup Language‹ (XML) als ›Scalable Vector Graphics‹ (SVG) exportiert und dienen als automatischer Vorentwurf einer Umzeichnung. Sie bilden wiederum die digitale Datengrundlage für Verfahren des Maschinellen Lernens im Bereich der ›Handwritten Text Recog­nition‹ (HTR) oder der ›Optical Character Recogni­tion‹ (OCR).

Obwohl die Domäne der Keilschriftzeichen bereits ein großer Anwendungsbereich ist, können die Methoden der 3D-Datenverarbeitung mit GigaMesh generell für Schrift in 3D verwendet werden. Bei den mittelalterlichen hebräischen Texten des ›Heiligen Sand‹ in Worms konnten damit 20 % an zusätzlichen Schriftzeichen lesbar gemacht werden. Im Bereich der Vielzahl an römischen Inschriften konnte die Interpretation von mehrfach bearbeiteten Abkürzungen präzisiert werden. Darüber hinaus findet sich Schrift in 3D auf vielen anderen Objekten wie Münzen, Siegelabdrücken oder Bleitäfelchen wieder.

 

 
Literatur

Krömker, Susanne (2013), »Neue Methoden zur besseren Lesbarkeit mittelalterlicher Grabsteine am Beispiel des Heiligen Sands in Worms«, in: Generaldirektion Kulturelles Erbe Rheinland-Pfalz (Hg.): Die SchUM-Gemeinden Speyer – Worms – Mainz. Auf dem Weg zum Welterbe, 167–188.

Mara, Hubert (2016), »Made in Humanities: Dual Integral Invariants for Efficient Edge Detection«, in: IT – Information Technology 58 (2) (Sonderausgabe Computer Sciences in the Humanities).

Mara, Hubert (2012), Multi-Scale Integral Invariants for Robust Character Extraction from Irregular Polygon Mesh Data, Dissertation Universität Heidelberg.

Soden, Wolfram von (2006), Der Alte Orient. Eine Einführung (erw. Sonderausg. d. 2. unv. Auflage 1992).

Weitere Verweise

Die Webseite zum GigaMesh-Projekt.

Paper von Hubert Mara (et.al.) zur Digitalisierung von Keilschrifttafeln (Kurzzusammenfassung auf Deutsch).

Webseite des Digitalisierungsprojektes der Grabinschriften auf dem Jüdischen Friedhof "Heiliger Sand" in Worms (Bericht bei Spiegel online).

Der Spiegel über die Rekonstruktion zerstörten Kulturellen Erbes mit Hilfe von 3D-Technologie (mit ausführlichen Verlinkungen).

Die EU-geförderte "Europeana", ein digitales Museum europäischer Kulturgüter (hier eine Übersichtskarte).

Abbildungshinweis

Titelbild: Grafik: Hubert Mara.

 
  Wunderhorn Verlag Sonderforschungsbereich Materiale Textkulturen der Deutschen Forschungsgemeinschaft Universität Heidelberg  

Tontafeln in Vektorräumen

Algorithmen für Schrift in 3D (2012)

von Hubert Mara  (Informatik)

Querschnitt durch eine dreidimensional erfasste Keilschrifttafel

Die annähernd rechtwinkligen Abdrücke des Stylus sind deutlich zu sehen. Daraus ergeben sich die Volumina für die Kugeln, die im Bereich der Keile in etwa ¾ der Sphären füllen. Jede — in unterschiedlichen Farben gezeigte — Kugelgröße entspricht einer Dimension in den beispielhaft gezeigten höherdimensionalen Merkmalsvektoren. Diese bilden einen Vektorraum zur Berechnung von kontrastreichen Abbildungen und Extraktion von Zeichen mit dem ›Giga­Mesh-Software-Framework‹. Untersucht wurden unter anderem Tontafeln aus dem Vorderasiatischen Museum Berlin, der Sammlung des Seminars für Sprachen und Kulturen des Vorderen Orients (Assyriologie) der Universität Heidelberg und der in Heidelberg aufbewahrten Uruk-Warka-Sammlung des Deutschen Archäologischen Instituts, 2012.

Titelbild: Grafik: Hubert Mara.

Das geschriebene Wort wird meistens nur zweidimensional — als dunkle Linien auf einem hellen Hintergrund — wahrgenommen, wie man dies von Tinte auf Papier gewohnt ist. Während Tinte bereits 3000 Jahre vor unserer Zeitrechnung in Ägypten verwendet wurde, entstanden in den benachbarten Reichen im Nahen Osten verschiedene Schriftsysteme, die Tontafeln als Schreibmaterial genutzt haben. Anstelle von Tinte wurden mit einem eckigen Stylus keilförmige Eindrücke in den feuchten Ton gesetzt. Gruppen von Keileindrücken bilden die Keilschriftzeichen, die von zahlreichen Völkern über mehr als drei Jahrtausende genutzt wurden. Dies bedeutete gleichzeitig, dass Keilschrift zum Schreiben von verschiedensten Sprachen genutzt wurde. Um Keilschrifttafeln lesen zu können, benötigt man zusätzlich zu umfangreichen Sprachkenntnissen eine entsprechende Beleuchtung, da die Zeichen nur als Hell-Dunkel-Kontrast lesbar sind. Diese Beleuchtung ist im Vorderen Orient in Form von hartem Sonnenlicht ausreichend verfügbar. Da die Tontafeln meistens von Hand geformt wurden, sind deren Oberflächen typischerweise leicht gekrümmt. Daher müssen die Tafeln beim Lesen immer wieder neu ausgerichtet werden, um die dafür notwendigen Schlagschatten in den Keilen zu erzeugen.

Heutzutage werden Keilschrifttafeln weltweit verteilt in vielen Museen und Sammlungen aufbewahrt, in denen man oft nur wenig Zeit und Licht findet, um Umschriften oder -zeichnungen von den Originalen anzufertigen. Bei einem geschätzten Gesamtumfang von mindestens 500.000 an weltweit bekannten Tafeln bedeutet deren Autopsie vor Ort einen enormen Bedarf an Zeit und Reisemitteln. Daher ist die Altorientalistik (Assyriologie) stetig bemüht, eine möglichst rasche und genaue Dokumentation zu erreichen. Dabei wurden und werden unterschiedliche Techniken eingesetzt. Die Photographie und der Flachbettscanner stellen die günstigsten und schnellsten Verfahren dar, die je nach Qualität und Erhaltungszustand der Tafeln — im wahrsten Sinne des Wortes — die Keile im Schatten stehen lassen. Abgüsse aus Gips, chemische Verfahren sowie Holographie liefern ebenfalls beachtenswerte Ergebnisse, die allerdings zu einem hohen Preis erkauft werden müssen. Aufgrund des Fortschritts der digitalen Photographie ergab sich in den letzten Jahren mit den neuen Methoden der optischen Messtechnik die Möglichkeit, sehr genaue 3D-Vermessungen von Oberflächen durchzuführen. Zu den drei gängigsten Verfahren zählt die Kombination von strukturiertem Licht und stereoskopischem Sehen, das ›Reflectance Transformation Imaging‹ (RTI) und ›Structure from Motion‹ (SfM), das aus der Photogrammetrie hervorgegangen ist. Alle diese Verfahren ermöglichen das dreidimensionale Erfassen von kleinsten geometrischen Strukturen in der Größenordnung von 10 bis 20 µm. Aus den Serien von Rasterbildern dieser 3D-Scanner wird aus mehreren Bildpunkten ein dreidimensionaler Messpunkt (Vertex) berechnet und mit seinen nächsten Nachbarn zu einem Dreiecksgitter vernetzt. Bei Objekten in der Größe von Keilschrifttafeln wird deren Oberfläche typischerweise mit 5 bis 15 Millionen Vertices und in etwa doppelt so vielen Dreiecken beschrieben. Aus dem Bereich der Computergraphik (CG) steht eine Vielzahl an Darstellungsmöglichkeiten von 3D-Modellen zur Verfügung, die allerdings meistens auf globalen Methoden und/oder starken Vereinfachungen der Oberflächengeometrie basieren. Mit virtuellen Lichtquellen kann man eine Tafel beinahe so detailliert untersuchen wie das Original, während andere CG-Methoden keine ausreichend genaue Darstellung bieten. Daher verwenden wir lokale Filtermethoden, wie sie aus dem Bereich der Bildverarbeitung und Mustererkennung bekannt sind. Filter wie der bekannte Canny-Algorithmus bestimmen in einer kleinen Nachbarschaft den maximalen Anstieg (Gradient) eines Grauwertbildes und verfolgt diesen, um Linienzüge (Kanten) zu extrahieren.

Dieses Prinzip lässt sich auf die Dreiecksgitter der vermessenen Keilschrifttafeln adaptieren, indem die Krümmung der Oberfläche (Mannigfaltigkeit) für jeden Vertex berechnet wird. Dafür eignen sich insbesondere die sogenannten ›Integral Invarianten‹, bei denen Kugeln mit dem 3D-Modell geschnitten werden. Dabei wird in jedem Punkt der diskreten Mannigfaltigkeit eine Kugel positioniert sowie Schnittvolumen und -fläche berechnet. Beide Werte sind Näherungen für die gauß'sche und die mittlere Krümmung. Die ermittelten Werte sind durch die Punktsymmetrie der Kugel invariant gegen Rotation und Verschiebung (Translation). Die Schnittfläche berechnet sich aus der Summe (numerische Integration) der Dreiecksflächen. Die Dreiecke innerhalb der Kugel werden gleichzeitig als Deckflächen von Prismen genutzt, um das Schnittvolumen numerisch zu bestimmen. Der Radius der Kugeln ist de facto die Filterbreite und muss daher der Größenordnung der Keile, also des gesuchten Merkmals entsprechen. Da Merkmale in ihrer Größe variieren können, werden typischerweise verschiedene Radien verwendet, um eine Invarianz gegen Skalierung zu erreichen. Das gesamte Verfahren ist daher ein ›Mehr-Skalen Integral Invarianter‹ (MSII) Filter, der einer der grundlegenden Algorithmen im ›GigaMesh Software Framework‹ ist. Basierend auf dem MSII Filter werden Schriftzeichen in 3D im ersten Schritt mit maximalem Kontrast dargestellt. Im zweiten Schritt werden die Umrisslinien und Skelettlinien (Mittellinien) der Schriftzeichen entlang der Eindrücke der Oberfläche bestimmt. Diese Polygonzüge werden in der ›eXtensible Markup Language‹ (XML) als ›Scalable Vector Graphics‹ (SVG) exportiert und dienen als automatischer Vorentwurf einer Umzeichnung. Sie bilden wiederum die digitale Datengrundlage für Verfahren des Maschinellen Lernens im Bereich der ›Handwritten Text Recog­nition‹ (HTR) oder der ›Optical Character Recogni­tion‹ (OCR).

Obwohl die Domäne der Keilschriftzeichen bereits ein großer Anwendungsbereich ist, können die Methoden der 3D-Datenverarbeitung mit GigaMesh generell für Schrift in 3D verwendet werden. Bei den mittelalterlichen hebräischen Texten des ›Heiligen Sand‹ in Worms konnten damit 20 % an zusätzlichen Schriftzeichen lesbar gemacht werden. Im Bereich der Vielzahl an römischen Inschriften konnte die Interpretation von mehrfach bearbeiteten Abkürzungen präzisiert werden. Darüber hinaus findet sich Schrift in 3D auf vielen anderen Objekten wie Münzen, Siegelabdrücken oder Bleitäfelchen wieder.

Artikel als PDF

zum Autor

Hubert Mara ist Informatiker und Nachwuchsgruppenleiter des »Forensic Computational Geometry Laboratory« am Interdisziplinären Zentrum für Wissenschaftliches Rechnen (IWR) der Universität Heidelberg. Mittels computergestützter Methoden macht diese Forschungsgruppe Zeugnisse der Vergangenheit auf Artefakten wieder sichtbar und lesbar und legt so auch die Grundlage für automatisierte Auswertungsverfahren.

Literatur

Krömker, Susanne (2013), »Neue Methoden zur besseren Lesbarkeit mittelalterlicher Grabsteine am Beispiel des Heiligen Sands in Worms«, in: Generaldirektion Kulturelles Erbe Rheinland-Pfalz (Hg.): Die SchUM-Gemeinden Speyer – Worms – Mainz. Auf dem Weg zum Welterbe, 167–188.

Mara, Hubert (2016), »Made in Humanities: Dual Integral Invariants for Efficient Edge Detection«, in: IT – Information Technology 58 (2) (Sonderausgabe Computer Sciences in the Humanities).

Mara, Hubert (2012), Multi-Scale Integral Invariants for Robust Character Extraction from Irregular Polygon Mesh Data, Dissertation Universität Heidelberg.

Soden, Wolfram von (2006), Der Alte Orient. Eine Einführung (erw. Sonderausg. d. 2. unv. Auflage 1992).

Weitere Verweise

Die Webseite zum GigaMesh-Projekt.

Paper von Hubert Mara (et.al.) zur Digitalisierung von Keilschrifttafeln (Kurzzusammenfassung auf Deutsch).

Webseite des Digitalisierungsprojektes der Grabinschriften auf dem Jüdischen Friedhof "Heiliger Sand" in Worms (Bericht bei Spiegel online).

Der Spiegel über die Rekonstruktion zerstörten Kulturellen Erbes mit Hilfe von 3D-Technologie (mit ausführlichen Verlinkungen).

Die EU-geförderte "Europeana", ein digitales Museum europäischer Kulturgüter (hier eine Übersichtskarte).