Linguistische Korpora und Datensammlungen

Corpus do Português

Autor/Herausgeber: Davies, Mark/Ferreira, Michael
Veröffentlicht durch: Brigham Young University, Provo, UT
Publikationsdatum: 2006-
Zuletzt bearbeitet: 14.06.2014
Diachrones Korpus der portugiesischen Sprache, das 45 Millionen Wörter aus 57.000 portugiesischen Texten des 14. bis 20. Jahrhunderts umfasst. Sie können hier u. a. nach Lemmata, Phrasen und Wortarten suchen. Die Suche kann zudem auf bestimmte Zeitperiode

Corpus of Historical American English (COHA)

Autor/Herausgeber: Davies, Mark
Veröffentlicht durch: Brigham Young University, Provo, UT
Publikationsdatum: 2010-
Zuletzt bearbeitet: 10.06.2015
Das COHA-Korpus enthält 400 Millionen Wörter aus im Amerikanischen Englisch verfassten Texten aus dem Zeitraum zwischen 1810 und 2009. Zu den Texten des Korpus gehören fiktionale und nichtfiktionale Texte sowie Artikel aus Zeitungen und Magazinen, wobei d

Corpus Paralelo CLUVI/CLUVI Parallel Corpus

Autor/Herausgeber:
Veröffentlicht durch: Seminario de Lingüística Informática (SLI) = Computational Linguistics Group
Publikationsdatum:
Zuletzt bearbeitet: 16.06.2016
Kostenfrei durchsuchbares paralleles Korpus der Universität Vigo, das aus 18 Subkorpora mit einem Umfang von 68.431 bis 6.582.415 Wörtern besteht, von denen sich einige noch in der Entwicklung befinden.

Corpus Resource Database (CoRD)

Autor/Herausgeber: Tyrkkö, Jukka
Veröffentlicht durch: Research Unit for the Study of Variation, Contacts and Change in English (VARIENG)/University of Helsinki
Publikationsdatum:
Zuletzt bearbeitet: 19.05.2014
Umfangreiches Verzeichnis mit Korpora geschriebener und gesprochener Sprache zu verschiedenen Sprachstufen und regionalen Varianten der englischen Sprache.

CorpusExplorer

Autor/Herausgeber: Jan Oliver Rüdiger
Veröffentlicht durch:
Publikationsdatum: 2018
Zuletzt bearbeitet:
OpenSource Software für Korpuslinguist*innen und Text-/Data-Mining Interessierte. Der CorpusExplorer vereint über 50 interaktiven Auswertungsmöglichkeiten mit einer einfachen Bedienung. Routineaufgaben wie z. B. Textakquise, Taggen oder die grafische Aufbereitung von Ergebnissen werden vollständig automatisiert.