<p>Die MERLIN–Texte verfügen über eine Mehrebenen-Annotation. Sie sind lemmatisiert und mit Informationen zu Wortarten versehen (POS-Tagging). Darüber hinaus sind neben einer minimal korrekten Variante des Textes (Zielhypothese) auch spezifische Merkmale der Lernersprache (L2) annotiert. Welche Merkmale manuell und welche automatisiert mit Hilfe von Natural Language Processing (NLP) annotiert wurden, erfahren Sie unter: <aclass="reference"href="C_research.php#annotations"target="_blank">Forschen mit MERLIN</a>. </p>
<p>Die Grundlage für die Annotationen lernersprachlicher Merkmale (L2-Merkmale) bilden die Zielhypothesen. Die „minimale Zielhypothese" (<strong>TH1</strong>) ist eine ausschließlich grammatisch und orthographisch korrekte Version des L2-Texts. Auf sie beziehen sich Annotationen aus dem Bereich Grammatik und Orthografie (EA1). </p>
<p> Für einen Teil des Kernkorpus wurden zusätzlich L2-Merkmale aus den Bereichen Wortschatz, Soziolinguistik, Pragmatik und Verständlichkeit annotiert (EA2). Diese Phänomene sind sehr häufig keine Fehler. Diese Pilot-Annotationen haben einen eher explorativen Charakter und sollten umsichtig interpretiert werden. Sie beziehen sich auf die „erweiterte Zielhypothese” (<strong>TH2</strong>).</p>
...
...
@@ -227,7 +227,7 @@ require('F_mainsidebar.php');
<p>* [...] für die Annotation relevanter Ausschnitt {...} Korrektur des fehlerhaften Ausdrucks</p>