Elisabeth Rieken
Kontakt

Citatio: E. Rieken, hethiter.net/: HFR-Annotation (2021-12-31)

Prinzipien der lexikalischen und morphologischen Annotation in HFR

Die Texte des Basiscorpus sind lexikalisch und morphologisch annotiert. Ziel dieser Annotation ist grundsätzlich eine Erschließung der sprachlichen Form der Texte, die in der hethitischen Schriftkultur aufgrund der Funktions- und Verwendungsweise der Keilschrift erheblich vom Schriftbild abweichen kann.

mouse-over Ansicht mit Annotation

Ansicht eines Textes im Basiscorpus, mit Anzeige (magentafarben, durch
„Mouseover“-Funktion) der lexikalischen und morphologischen Analyse
des betreffenden Worts (grau hinterlegt).

Die lexikalische und morphologische Annotation erfolgt in einem dreistufigen Verfahren von automatischer Annotation und manueller Validierung.

(1) Im ersten Schritt (automatische Annotation) werden die belegten Wortformen mit einer Liste sämtlicher potenzieller Wortformen des gesamten Wortschatzes des Hethitischen abgeglichen und mit den Treffern verknüpft. Die auf diese Weise automatisch erzeugten Annotationsvorschläge beruhen auf einer ausschließlich morphologischen Analyse der erkannten Lexeme – ohne Einbeziehung des Kontexts. Im Falle mehrdeutiger Formen gibt es also mehrere Annotationsvorschläge. Diese automatisierte Annotation wird bereits für sämtliche Texte des Basiscorpus angeboten und ist durch die Mechanismen der HFR-Suche erschließbar. Im Mouseover und in der interlinearen Ansicht wird diese Annotationsstufe in grauer Schrift angezeigt.

(2) Im zweiten Schritt (manuelle Vorvalidierung) werden die Mehrfachvorschläge der automatischen Annotation innerhalb des Basiscorpus von Projektmitarbeitern unter Berücksichtigung der Syntax und des Textverständnisses soweit wie möglich reduziert. Neben eindeutigen lexikalischen und morphologischen Bestimmungen gibt es – vor allem in fragmentarischem Kontext – verbleibende Fälle von Ambiguität. Der Prozess der Vorvalidierung ist für viele der wichtigsten Festritual-Einzelmanuskripte bereits abgeschlossen. Im Mouseover und in der interlinearen Ansicht wird die vorvalidierte Annotationsstufe in magenta Schrift angezeigt.

mouse-over Ansicht mit Annotation

Interlineare Ansicht eines Textes im Basiscorpus: Die obere Zeile (grün) enthält die Transliteration des
Keilschrifttextes, darunter steht die Grundbedeutung mit morphologischer Glossierung (magenta).

(3) Die dritte und letzte Annotationsstufe erfolgt durch die manuelle Validierung im Zuge der Erstellung der Kritischen Editionen ausgewählter Festritualtexte. Die auf diese Weise validierte Annotation basiert auf dem Textverständnis, das nur im Zuge der Textrekonstruktion, Übersetzung und Kommentierung erlangt werden kannt.

Weitere Informationen zu den Annotationsprinzipien werden im Folgenden unter 1–8 nach einzelnen Themen- und Problemfeldern dargelegt. Eine detaillierte Dokumentation der Annotation befindet sich in den internen Handreichungen. Eine Liste der Abkürzungen der morphologischen Glossierung kann in HTML (in einem eigenen Fenster) oder als PDF abgerufen werden.

  1. Allgemeines
  2. Umgang mit fremdsprachigem Material
  3. Default-Entscheidungen bei ambigen Kasusformen, Lokalpartikeln und Logogrammen
  4. Inhalts- und Maßangaben
  5. Numeruskongruenz nach Kardinalzahlen
  6. Kasus in Listen
  7. Graphische Klammern durch akkadische Kasusklassifikatoren
  8. Sumerographische Adpositionen
1. Allgemeines
  • Es wird prinzipiell die Paradigmastelle angegeben, nicht die Form; d.h. das (syntaktische) Textverständnis wird in die Annotation einbezogen und im System angelegte morphologische Ambiguität (z.B. beim Nominativ/Akkusativ des Neutrums), soweit es der Kontext zulässt, beseitigt.
  • Bei mehrdeutiger morphologischer Bestimmung werden alle Möglichkeiten angegeben. In fragmentarischem Kontext wird ein Wort nur dann eindeutig annotiert, wenn die Form absolut sicher und auf Basis des Kontexts oder der Textgattung bestimmt werden kann. Andernfalls werden alle Möglichkeiten angegeben.
  • Bei Formen, die hinsichtlich ihrer Flexionsklasse mehrdeutig sind, wird nur eine der Möglichkeiten, und zwar die übliche Flexionsklasse, angegeben.
  • Steht im Text eine irreguläre Form, die weder ins Paradigma aufgenommen noch im Basiscorpus geändert werden soll, wird die richtige morphologische Analyse im Zuge der händischen Annotation mit einem Ausrufezeichen in Klammern markiert.
2. Umgang mit fremdsprachigem Material
  • Zusammenhängende hurritische und hattische Textpassagen werden nicht morphologisch annotiert. Sie werden lediglich automatisch als ‚HUR‘ bzw. ‚HAT‘ bestimmt.
  • Eingebettet in hethitischen Kontext werden hurritische und hattische Wortformen soweit möglich lexikalisch und morphologisch annotiert.
  • Palaische Textpassagen sind annotiert.
  • Luwische Textpassagen sollen in Zukunft annotiert werden.
3. Default-Entscheidungen bei ambigen Kasusformen, Lokalpartikeln und Logogrammen
  • Wenn im Ritualkontext nach einem Gegenstand gerufen wird, ist das betreffende Nomen als Nominativ annotiert (z.B. „Die Zither (scil. soll gebracht werden)!“).
  • Trotz des nach-althethischen Kasussynkretismus von Ablativ und Instrumental werden alle Fälle, wo beide Kasus in Frage kommen, weil sie nicht unterschiedlich markiert sind, sowohl als Ablativ wie auch als Instrumental annotiert, da die junghethitischen Schreiber auch althethitische Instrumentalformen kopiert haben könnten (z.B. jh. IŠ-TU BI-IB-RI mit der Annotation als INS und ABL).
  • Lokalpartikeln wie anda, die als Adverbien, Präverbien oder Postpositionen gedeutet werden können, werden in absoluter oder elliptischer Verwendung als Adverbien (ADV) annotiert.
  • Bei Logogrammen ist der Singular der Default-Numerus. Als Pluralformen werden Logogramme nur dann annotiert, wenn sie durch ein Pluraldeterminativ markiert sind. Nach Kardinalzahlen gelten jedoch die entsprechenden Regeln (siehe unter 5).
4. Inhalts- und Maßangaben
  • Default-Kasus bei unkomplementierten Logogrammen für das Material oder den Inhalt eines Gegenstands ist der Genitiv. Die appositionelle Konstruktion (Typ ‚eine Flasche Milch‘) wird hier in der Annotation nicht angewendet:
    • DUGtapišaniš KÙ.SI₂₂ (GEN.SG) ‚ein t.-Gefäß aus Gold‘,
    • DUGtaḫašiuš=ma GEŠTIN (GEN.SG) ‚ein t.-Gefäß mit Wein‘,
    • aber eindeutig markiert: DUGḫuppar GEŠTIN-it (INS) ‚eine Schale mit Wein‘.
  • Das Gleiche gilt bei TA-PAL ‚ein Paar‘ (+ GEN).
  • Anders wird die Annotation bei Maßen, Gewichten, Werteinheiten und memal- ‚Grütze‘ gehandhabt: Hier stimmen Einheit und Gemessenes im Kasus überein; das Gemessene bildet also eine Apposition zur Einheit:
    • 4 (QUAN) GÍN (NOM.SG) KÙ.SI₂₂ (NOM.SG) ‚vier Schekel Gold‘
  • Nachgestellte Gewichts- oder Maßeinheiten stehen selbst aber im Genitiv: tarnaš und UP-NI ‚von einer Hand voll‘.
    • 4 (QUAN) NINDAḫaršauš (NOM.PL) tarnaš (GEN.SG) ‚vier ḫ.-Brote von einer Hand voll‘
5. Numeruskongruenz nach Kardinalzahlen

Es werden bei der Annotation von unmarkierten Nominalausdrücken die folgende Regeln zugrundegelegt. Auf Kardinalia ≥ 2 folgen

  • im Plural semantisch belebte Communia (Götter, Menschen, Tiere, auch menschliche Körperteile) sowie semantisch unbelebte Communia nach 2–4;
    • Ausnahme 1: Kollektiva (wie Soldaten, Gefallene, Geiseln, Reisende, Herdentiere und Vögel) werden als Singularformen annotiert, z.B.: 80 MUŠENḪI.A (SG) ḫu-el-pí-iš ‚80 junge Vögel‘.
    • Ausnahme 2: In Listen (vor allem von Opfergaben und Ritualzurüstungen) stehen die Listenbestandteile oft außer semantisch belebten Communia im Singular, auch wenn das Kardinale 2, 3 oder 4 ist.
  • im Singular (auch wenn ein Pluraldeterminativ vorhanden ist) Neutra sowie semantisch unbelebte Communia nach Kardinalia ≥ 5;
    • Ausnahme: Wenn Gegenstände im nachfolgenden Kontext voneinander getrennt oder verteilt werden, werden die Nominalausdrücke als distributive Pluralformen annotiert.
    • NB: Default für unklare Fälle, z.B. wenn keine hethitische Entsprechung eines Logogramms bekannt ist, ist Annotation durch beide Numeri (SG und PL).
    • NB: Nach Kardinalzahlen wird das Vorhanden- bzw. Nichtvorhandensein von Pluraldeterminativen vernachlässigt. Vielmehr gelten die obenstehenden Regeln für Numeruskongruenz nach Kardinalzahlen unbenommen.
6. Kasus in Listen

In Listen (vor allem von Opfergaben und Ritualzurüstungen) wird unterschieden zwischen

  • „syntaktisch unabhängigen Listen“ (von kiššan, QATAMMA u.ä. eingeleitet und nicht mit einer Verbalform abgeschlossen):
    • Die gelisteten Elemente stehen typischerweise im Nominativ. Hier sind die Elemente als NOM annotiert. Kommt in einer ansonsten “syntaktisch unabhängigen Liste” dennoch eine Akkusativform vor, ist diese als intendierter Nominativ annotiert unter Zusatz von (!), z.B. NOM.SG.C(!);
  • „Listen innerhalb eines Satzes“ (mit einer Verbalform wie da(nz)i, pai, piyanzi, išpanti usw. am Ende der Liste):
    • Die Elemente der Liste fungieren syntaktisch als direkte Objekte der Verbalform und stehen typischerweise im Akkusativ. Hier sind die Elemente als ACC annotiert. Kommt in einer „Liste innerhalb eines Satzes“ dennoch eine Nominativform vor, ist diese als intendierter Akkusativ unter Zusatz von (!) annotiert, z.B. ACC.SG.C(!).
  • In unklaren Fällen, etwa in fragmentarischem Kontext, ist der Nominativ als Default-Kasus gebraucht. Wenn jedoch eine eindeutige Akkusativform auftritt und ansonsten keine abweichende Kasusform identifizierbar ist (z.B. da sonst nur Logogramme vorliegen), werden die Formen als ACC annotiert, und der Kasus kann von dieser Form auf die gesamte Liste verallgemeinert werden.
  • Wenn Stammformen als pseudo-logographisch verwendet werden, wenn also die Wörter keine Endungen zeigen, sind sie unter Zusatz von „(UNM)“ als die erwartete Kasusformen annotiert. Der Default-Numerus ist der Singular, wenn es keine widersprechenden Indizien gibt, z.B.:
    • 3 (QUAN) PA (NOM.SG) ZÌ.DA (NOM.SG) še-ep-pí-it (GEN.SG(UNM)(!)) ar-ra-an-ta-aš (GEN.SG)
    • 5 (QUAN) DUGpal-ḫi (NOM.SG(UNM)) GAL (NOM.SG(UNM)) – N.B.: palḫi ist kein Neutrum!
    • 3 (QUAN) PA-RI-SI še-ep-pí-it-ta-aš (GEN.SG) ar-ra-an-za (GEN.SG(UNM)(!))
7. Graphische Klammern durch akkadische Kasusklassifikatoren
  • In IŠ-TU MUNUS.LUGAL GIŠBANŠUR ‚vom Tisch der Königin‘ markiert der Kasusklassifikator IŠ-TU nicht das unmittelbar folgende Logogramm MUNUS.LUGAL ‚Königin‘, sondern GIŠBANŠUR ‚Tisch‘ als Ablativ. Um dies zu verdeutlichen, ist ausnahmsweise auch der Kasusklassifikator annotiert (CLFcas-np).
8. Sumerographische Adpositionen
  • Die sumerographischen Adpositionen EGIR, ŠÀ und TA werden mit dem von ihnen regierten Nominalausdruck für die Annotation zu einer einzigen Einheit zusammengefasst (durch Unterstrich verbunden), z.B.:
    • EGIR GIŠBANŠUR ‚hinter dem Tisch‘ (Tisch:D/L_hinter:POSP).
    Während also auf der grafischen Ebene die sumerische bzw. akkadische Wortstellung mit der Adposition vor dem regierten Substantiv vorliegt, findet in der Annotation die dahinterstehende umgekehrte hethitische Wortstellung (regiertes Substantiv – Adposition) Berücksichtigung.