Klosterfrauenkorpus

Ein annotiertes Textkorpus zum Sprachgebrauch süddeutscher Klosterfrauen des 17. Jahrhunderts

TeiHeader Rohtexte GATE-XML relANNIS

Poster DGfS 2019

Hier finden Sie die Betaversion des Klosterfrauenkorpus, das auf der Edition von Nolting (2010) beruht. Bitte beachten Sie, dass diese Version ausschließlich über automatische Annotationen verfügt, die mit CAB (Jurish 2012) erstellt wurden. Eine manuelle Nachkorrektur der bestehenden Annotationen sowie das Hinzufügen weiterer Annotationsebenen ist für die nahe Zukunft geplant.

Über die obigen Links haben Sie Zugriff auf den (derzeit noch minimalistischen) TEI-Header, die Rohtexte im .txt-Format, eine erste Betaversion im relANNIS-Format zur Verwendung mit einer lokalen Installation von ANNIS (Krause & Zeldes 2016) sowie die Dateien im GATE-XML-Format für das Annotationsprogramm GATE, das für die – weitestgehend noch ausstehende – manuelle Annotation verwendet wird.

Wir danken dem Waxmann-Verlag für die Genehmigung zur korpuslinguistischen Aufbereitung und Zugänglichmachung der Texte. Bei Verwendung des Korpus zitieren Sie bitte die Edition von Nolting (2010) [Bibtex]. Für das Korpus selbst schlagen wir folgende Zitierweise vor:

Nowak, Jessica, Stefan Hartmann & Uta Nolting. 2019. Klosterfrauenkorpus. Ein annotiertes Textkorpus zum Sprachgebrauch süddeutscher Klosterfrauen des 17. Jahrhunderts. Version 0.1 (Betaversion). Universität Mainz, Universität Düsseldorf. doi 10.5281/zenodo.2583198.[Bibtex]

(aus Nolting 2010: 50f.)

Chronikalische Texte

Brieftexte

Bereits vorhandene Annotationsebenen

Noch nicht implementierte Annotationsebenen und Arbeitsschritte (in Auswahl)

Wie oben bereits erwähnt, dient diese Version des Korpus nur Demonstrationszwecken. Für den tatsächlichen Einsatz ist sie nur bei genauer manueller Prüfung der Ergebnisse geeignet. Insbesondere sind die automatischen Annotationen noch sehr fehlerbehaftet. Weiterhin ist Folgendes zu beachten:

Cunningham, Hamish, Diana Maynard, Kalina Bontcheva & Valentin Tablan. 2002. GATE: A Framework and Graphical Development Environment for Robust NLP Tools and Applications. Proceedings of the 40th Anniversary Meeting of the Association for Computational Linguistics (ACL’02).

Jurish, Bryan. 2012. Finite-state Canonicalization Techniques for Historical German. PhD Thesis, University of Potsdam. urn:nbn:de:kobv:517-opus-55789.

Krause, Thomas & Amir Zeldes. 2016. ANNIS3: A new architecture for generic corpus query and visualization. Digital Scholarship in the Humanities 31(1). 118–139.

Nolting, Uta. 2010. Sprachgebrauch süddeutscher Klosterfrauen des 17. Jahrhunderts. (Studien und Texte zum Mittelalter und zur frühen Neuzeit 16). Münster: Waxmann.



Hosted by GitHub Pages. View on GitHub