Korpora geschriebener Sprache

Nederlab

Autor/Herausgeber: Sijs, Nicoline van der
Veröffentlicht durch: Meertens Instituut, Amsterdam
Publikationsdatum: 2015
Zuletzt bearbeitet: 01.06.2015
Korpus zur Untersuchung der Entwicklungen in der niederländischen Sprache, Literatur und Kultur mit Texten von etwa 800 bis zur Gegenwart. Im März 2015 sind bereits mehr als 4 Millionen Texte von gut 95.000 Autoren enthalten.

NEGRA Korpus

Autor/Herausgeber: Kruijff, Geert-Jan M./Plaehn, Oliver/Stenzhorn, Holger/Brants, Thorsten
Veröffentlicht durch: FR 4.7 Computerlinguistik/Universität des Saarlandes, Saarbrücken
Publikationsdatum: 11.05.2006
Zuletzt bearbeitet: 06.09.2016
Das NEGRA Korpus ist ein syntaktisch annotiertes Korpus deutscher Zeitungstexte, das für wissenschaftliche Zwecke kostenfrei zur Verfügung gestellt wird.

Ordnet.dk

Autor/Herausgeber: Trap-Jensen, Lars
Veröffentlicht durch: Det Danske Sprog- og Litteraturselskab
Publikationsdatum:
Zuletzt bearbeitet: 01.10.2015
Frei zugängliche Ressource, die Zugriff auf verschiedene Ressourcen zur dänischen Sprache ermöglicht.

Oslo Multilingual Corpus (OMC)

Autor/Herausgeber: Ebeling, Signe Oksefjell
Veröffentlicht durch: Institutt for litteratur, områdestudier og europeiske språk = Department of Literature, Area Studies and European Languages/Universitetet i Oslo = University of Oslo
Publikationsdatum: 2010-
Zuletzt bearbeitet: 12.05.2014
Internetsite zum multilingualen Korpus der Universität Oslo und seinen Sub-Korpora.

Potsdam Commentary Corpus (PCC)

Autor/Herausgeber: Stede, Manfred
Veröffentlicht durch: Applied Computational Linguistics Discourse Research Lab/Department Linguistik/Universität Potsdam
Publikationsdatum:
Zuletzt bearbeitet: 02.10.2018
Das 'Potsdam Commentary Corpus' umfasst 220 Texte der Textsorte Kommentare (2.900 Sätze, 44.000 Tokens) aus den Zeitungen 'Märkische Allgemeine Zeitung' und 'Der Tagesspiegel'. Das Korpus wurde mit verschiedenen Tools annotiert.