European Corpus Initiative Multilingual Corpus I (ECI/MCI)

URL European Corpus Initiative Multilingual Corpus I (ECI/MCI)
Autor / Herausgeber Krauwer, Steven
Veröffentlicht durch European Networks of Excellence in Human Language Technologies (ELSNET)
Publikationsdatum 11.05.2012

Beschreibung der Ressource

Das ECI-Korpus (CD-ROM) ist ein multilinguales Textkorpus, das rund 98 Millionen Wörter umfasst. Es sind europäische (Deutsch, Englisch, Schwedisch, Italienisch etc.) und nicht-europäische Sprachen (Albanisch, Japanisch, Russisch) darin vertreten. Das Korpus besteht sowohl aus monolingualen Textkorpora, die hauptsächlich auf Zeitungsartikeln beruhen, als auch aus Parallelkorpora, die authentische Texte der Europäischen Union umfassen. Die CD-ROM kann für 50 Euro bestellt werden. Sie enthält u. a. Texte der 'Frankfurter Rundschau' (Juli 1992 - März 1993), der französischen Zeitung 'Le Monde' sowie des Leidener Korpus des Niederländischen.
Autor/in dieses Eintrags BB/MW/JBA

Format text/html
Publikationssprache Englisch
Ressourcentyp Korpora/Forschungsdaten
Zugang kostenpflichtig
Land Niederlande
Schlagwörter mehrsprachige Korpora, Textkorpora, Annotation, Part-of-speech Tagging, Transkription
Thematische Klassifikation Korpuslinguistik
Sprache Englisch, Französisch, Niederländisch, Albanisch, Bulgarisch, Chinesisch/Mandarin, Tschechisch, Estnisch, Gälisch-Schottisch, Irisch-Gälisch, Deutsch, Neugriechisch, Italienisch, Japanisch, Latein, Litauisch, Malaiisch, Spanisch, Serbisch, Kroatisch, Slowenisch, Dänisch, Usbekisch, Norwegisch, Portugiesisch, Russisch, Schwedisch, Türkisch
Datum der Aufnahme in die LinseLinks 07.08.2012
Zuletzt bearbeitet 18.06.2014; MW

Zurück