HPM Guide

XML und die Aufbereitung altorientalischer Texte und anderer Dokumente für die EDV und das Internet

Das Prinzip

Traditionelle Umschrift, Textverarbeitung und XML

Üblicherweise wird für Editionen wie für andere Arbeiten ein Textverarbeitungsprogramm verwendet. Das hat den Vorteil, dass der Nutzer an seine Handhabung gewöhnt ist und sich wenig Gedanken über technische Fragen machen muss.

Nachteilig ist zum einen, dass sich die erzeugten Texte nicht ohne das jeweilige Programm lesen lassen, und zum anderen, dass die Bedeutung und Funktion von Teilen des Textes nicht eindeutig erkennbar ist, obwohl sie vielleicht sogar markiert wurde, etwa durch Kursivierung.

Ohne das Textverarbeitungsprogramm sähe ein Text aus wie oben. Das kann vermieden werden, indem man nur noch Zeichen verwendet, die weltweit in den Computersystemen definiert sind, und mit einem simplen Editor geschrieben werden können.

Dann gäbe es zur zur Gliederung eines Textes aber nur noch Tabulator und Absatz. Durch XML (extensible markup language), das noch größere Freiheiten erlaubt als das milliardenfach verwendete HTML der Webseiten, lässt sich das beheben: Je nach Zweck lassen sich Teile eines Textes markieren (oben rechts), nicht nur graphisch, sondern auch inhaltlich.

Aber möchten Sie alles in XML tippen? Mit Staroffice, Openoffice, Neooffice und Libreoffice, die auf dem ODF (Open Document Format) aufbauen, erübrigt sich das.

Eine gewöhnliche Textumschrift enthält bereits zahlreiche Markierungen, die aber üblicherweise nicht eindeutig gesetzt werden. Meist werden selbst Überschriften durch Vergrößerung der Schrift, das Anklicken von Fett und Unterstrichen formatiert. All das ließe sich durch einfaches Auswählen des Stils „Überschrift“ erreichen

Im Beispiel oben werden Hochstellung und Kursivierung versus „Kapitälchen“ verwendet, um die Zeilennummer, hethitischen Text und Logogramm zu differenzieren. An anderen Stellen eines Textes können Kursivierungen und Hochstellungen ganz andere Funktionen haben.

So wie der Stil „Überschrift“ es einem Programm ermöglicht, z.B. ein Inhaltsverzeichnis automatisch zu erstellen, können bei der Verwendung von Stilen auch verschiedenartige Kursivierungen ausgewertet werden.


Geht man von einer völlig unmarkiert eingegebenen Zeile aus (Text aus alten Dateien am besten mit „Format → Standardformat“ bereinigen), markiert man zunächst die Grundfunktion eines Absatzes, hier „AO:Textline-Hit“ (d.h. die ganze Textzeile bzw. der Absatz ist hethitischer Text) im Menü der Paragraphenstile .

Die Farben dienen lediglich der Übersichtlichkeit!

Tabellen, Paragraphen und Buchstabenstile

Unterhalb der Paragraphenebene kommen Zeichenvorlagen a zum Einsatz, um Elemente eines Absatzes zu markieren. Innerhalb der hier bereits als hethitischer Text markierten Zeile/Paragraphen sind das das Sumerogramm (AO:Sumgram) und die Zeilenangabe (an der Cursorstelle).

Oberhalb der Paragraphenebene verknüpft eine Tabellenzeile automatisch die in den einzelnen Zellen enthaltenen Informationen (hier die hethitische Textzeile mit der Angabe des Textexemplars A1 und der der Kolonnummer 381).

Um XML muss sich der Bearbeiter nicht weiter kümmern, denn das steckt in den ODT-Dateien der genannten Textverarbeitungsprogramme (diese sind eigentlich ZIP-Dateien):

Wir empfehlen die genannten Programme Staroffice, OpenOffice, NeoOffice und LibreOffice. Selbstverständlich können auch andere Programme verwendet werden, sofern sich deren Dateien in eines der genannten importieren lassen.

Dieses Prinzip der Textauszeichnung lässt sich auch gut für andere Projekte anwenden, in denen alte Manuskripte für eine datentechnische Weiterverwertung aufbereitet werden sollen, da die Auszeichnung rasch mit Hilfe des Gießkannenmodus wie mit einem Textmarker durchgeführt werden kann.

Die Erstellung von Partiturumschriften

Für die Darstellung im Internet werden die Texte in drei Dokumente unterteilt (vgl. die beigefügten Dateien):

  • Die Einführung ( ..._in.odt)

  • Die Transliteration ( ..._tx.odt)

  • Die Übersetzung (..._ DE-tr.odt, ..._IT-tr.odt etc.)

Ferner werden für jede Textgruppe ein Literaturverzeichnis und ein Inhaltsverzeichnis angelegt

Die Einführungsdatei

Zunächst öffnet man das Dokument „Vorlage-Intro“, das bereits die notwendigen Formatierungen enthält.

An entsprechender Stelle sind die Eingaben vorzunehmen:

- Titel

- CTH-Nr. (bzw. die Textnr., unter der alle Exemplare einer Komposition registriert sind).

- Die Textüberlieferung mit Auflistung der zum Textcorpus zugehörigen Texte, danach kann eine Übersicht über den Texterhalt und die Datierung der einzelnen Textvertreter erfolgen;

- Die Editionsgeschichte, in der Fundumstände und Ersteditionen der Texte, Bearbeitungen, Aufsätze etc. sowie der Name desjenigen, der die Internetversion erstellte, vermerkt werden können;

Dem kann eine Inhaltsübersicht folgen, die entweder in tabellarischer Form oder als Fließtext dargestellt werden kann.

Das Dokument ist abschließend unter der entsprechenden CTH-Nr zu speichern (in der Form „CTH nnn_in“), also z.B. CTH 234.II.4_in.

Je nach Textgeschichte können einzelne Teile eines Exemplars auch durch Indizes unterschieden werden: A2 .

Die Transliteration

Für die Transliteration kann das Dokument „Vorlage-Translit“ aufgerufen werden.

Wir empfehlen, mit dem Cursor den Text durchzugehen, um die Anwendung der Paragraphenstile und Zeichenstile nachzuvollziehen.

Die Tabelle kann durch „Tabelle“ – „Einfügen“ – „Zeilen“ oder das Weitergehen mittels TAB problemlos erweitert werden.

In der Vorlage ist der einzugebene Text bereits als hethitischer Text markiert, so dass nur die nicht hethitischen Bestandteile eines Kolons markiert werden müssen! Denn der Stil des Paragraphen ist voreingestellt als AO:Textline-Hit. Je nach Sprache des Textes muss der Paragraphenstil gewählt werden.

Innerhalb dieser Stilvorgabe wird der Text automatisch kursiv angezeigt und ist durch die Zuordnung des Paragraphenstils auch eindeutig als hethitisch identifiziert, d.h. die einzelnen hethitischen Worte müssen NICHT mehr als AO:Hittite o.ä. gekennzeichnet werden, sondern nur Determinative, Zeilennummern, Logogramme und anderes, nicht Hethitisches.

Passagen in einer anderen Sprache innerhalb eines Textes werden, sofern sie ganze Sätze bilden und deutlich abgesetzt sind, ebenfalls mit dem Paragraphenstil der Sprache zugeordnet, z.B. Abschnitte in Hurritisch als AO:Textline-Hurr innerhalb von hethitischen Ritualen. Der Buchstabenstil AO:Hurrian hingegen wird nur zur Markierung von in einen Satz eingeschobenen Zitaten oder unvollständigen Zitaten bzw. zur Markierung in den Anmerkungen genannter, hurritischer Wörter verwandt.


AO:--index

Markierung von Index-Ziffern NA

AO:--superscr

Markierung von Hochstellungen -ta!-

AO:-LineNrExpl

Markierung der Zeilenangaben

AO:-LIT

Markierung der Literaturangaben (Name Jahr), z.B. Groddek 2009

AO:-Text-Gap

Markierung zusätzlicher Informationen wie z.B. Rasur

AO:Akkadian

Markierung akkadischer Textabschnitte oder Wörter

AO:AkkGRAM

Markierung von Akkadogrammen

AO:Determ.

Markierung von Determinativen

AO:DocSigl

Markierung der Textnummer in den Dokumenten-Überschriften, bei hethitischen Texten die CTH-Nr.

AO:editor

Markierung des Bearbeiters im Inhaltsverzeichnis

AO:Hattian

Markierung hattischer Wörter in Transliteration und Übersetzung

AO:Hittite

Markierung hethitischer Wörter in Übersetzungen

AO:Hurrian

Markierung hurritischer Wörter in Transliteration und Übersetzung

AO:InvNr

Markierung der Textinventarnr. auf der Introseite sowie in Fußnoten (nur z.B. Bo 2030, nicht „+“, „(+)“ o.ä.)

AO:Luwian

Markierung luwischer Wörter in Transliteration und Übersetzung

AO:Numeral.

Markierung von Zahlen

AO:Sumerian

Markierung sumerischer Textabschnitte oder Wörter

AO:SumGRAM

Markierung von Sumerogrammen

AO:TxtPubl

Markierung der Textpublikation auf der Introseite sowie in Fußnoten (nur z.B. KUB 29.1, nicht „+“, „(+)“ o.ä.)

AO:CTH-Link

Markierung von CTH-Nr. in Fußnoten

Bitte beachten:

  • Kopiert man den Text aus einer älteren Datei (z.B. Word) muss diese zunächst mit einer UTF-Kodierung abgespeichert werden: in Word unter „Datei“ – „Speichern unter...“ – Format „Unicode Text (UTF 16)“

  • Lücken: Bei bekannter Zeichenanzahl in den Lücken wird für jedes Zeichen „_“ verwendet; Lücken unbekannter Größe werden mit „…“ markiert; im Mastertext wird immer „[…]“ geschrieben.

  • Die Einteilung in Paragraphen richtet sich in aller Regel nach den Paragraphenstrichen des Haupttextes; Abweichungen können sich durch Sinnzusammenhänge ergeben. Paragraphenstriche und Tafelenden werden darüberhinaus in den Einzelexemplaren markiert (¬¬¬ oder === für Doppelstriche), nicht jedoch in Mastertext und Übersetzung.

  • Paragraph lines are marked in each exemplar (¬¬¬ or === für double lines), but not in the master text.

  • Gleitlaute werden durch /y/ und /w/ dargestellt, Vokale angeglichen (z.B. nicht „_i-e_“ transliterieren ohne morphologischen Grund).

Zur Codierung des Hurritischen

  • analytische Umschrift nach den in der Hurritologie üblichen Kriterien (siehe z.B. I. Wegner, Einführung, 2000, 39ff. und G. Wilhelm, Hurrian, in: Woodard, R. D. (ed.), The Cambridge Encylopedia of the World’s Ancient Languages, 2004, 98f.)

  • - Unterscheidung von stimmhaften und stimmlosen Konsonanten (somit auch von Einfach- und Doppelkonsonanz) (auch Verwendung der Zeichen ġ und ž)

    stimmhaft: wenn Konsonant intervokalisch (a-ta-ni zu adani); im Wortauslaut; in Kontaktstellung mit l, m, n, r (ar-te zu arde)

    stimmlos: am Wortanfang (da-ḫe zu taġe); in Kontaktstellung mit anderen Konsonanten ≠ l, m, n, r; doppelter Konsonant (ad-da-ni zu attani)

    - Unterscheidung von /e/ und /i/ (diese – wie auch die folgenden Unterscheidungen – ist wichtig, um verschiedene Wörter und Morpheme zu trennen)

    - Unterscheidung von /u/ und /o/

    - Unterscheidung von /p/ bzw. /b/ und /f/ bzw. /v/ bzw. /w/

    - aber:

    Angabe der Pleneschreibung durch ā, ē, ī, ō, ū (in Zukunft vielleicht nützlich, um Wörter zu unterscheiden (vgl. z.B. ḫa-aš- und ḫa-a-aš-))

    keine Verwendung von j

    Die Umschrift der Wörter sollte dem entsprechen, was man in der aktuellen Literatur (z.B. Glossare) findet. Sollten verschiedene Wiedergaben eines Wortes (z.B. ob /p/ oder /f/ geschrieben werden sollte) existieren, könnte man p/f… schreiben.

    Zweite Zeile:

  • vereinfachte gebundene Umschrift

  • - keine Unterscheidung von Einfach- und Doppelkonsonanz

    - nur stimmlose Konsonanten

    - keine Unterscheidung von /e/ und /i/ (nur /i/ wird verwendet)

    - keine Unterscheidung von /u/ und /o/ (nur /u/ wird verwendet)

    - nur /p/ (also kein /f/)

    - keine Angabe der Pleneschreibung

    - Bevorzugung der jeweils niedrigsten Silbenwerte

Das so erstellte Dokument sollte in der Form „CTH nnn_tx“ abgespeichert werden.

Die Übersetzung

Für die Übersetzung ist das Dokument „Vorlage-Translat“ aufzurufen, in dem die Formatvorlagen bereits in der erforderlichen Weise vorbereitet sind.

Auch hier sind Titel und CTH-Nr. des bearbeiteten Rituals einzutragen; für die rechte Spalte ist die Formatvorlage entsprechend der Sprache der Übersetzung auszuwählen (bislang Deutsch, Englisch, Französisch, Italienisch).

Das Dokument ist in der Form „CTH nnn_DE-tr“ oder „CTH nnn_EN-tr“ bzw. „CTH nnn_FR-tr“ bzw. „CTH nnn_IT-tr“ abzuspeichern.

Redaktion Susanne Görke, Gerfrid G.W. Müller