von
In einer Kooperation zwischen dem Lehrstuhl für slavische Sprachenwissenschaft der Uni Tübingen und dem Lehrstuhl für Slavische Philologie der Uni Freiburg ist eine Sammlung Slavischer Kopora entstanden, die weiter gepflegt wird. Sollten Sie Korpora kennen, die noch nicht aufgeführt…
von
English-Corpora.org is the most widely used collection of corpora (highly searchable collections of texts) anywhere in the world. The corpora are used by more than 130,000 people each month, from more than 140 countries. In…
von
Die »Wörter des Tages« zeigen, welche Begriffe heute besonders aktuell sind. Dazu werden verschiedene Tageszeitungen und Newsdienste täglich ausgewertet. Die »Wörter des Tages« stehen morgens ab etwa 7 Uhr zur Verfügung.Die Aktualität eines Begriffs ergibt…
von
Der amerikanische Sprachwissenschaftler Mark Davies von der Brigham Young University stellt fünf Korpora für das Spanische zur Verfügung.
von
Die DGD, eine Datenbank für Gesprochenes Deutsch des Instituts für Deutsche Sprache (IDS) in Mannheim, bietet den Zugriff auf ausgewählte Korpora des Archivs für Gesprochenes Deutsch (AGD) wie zum Beispiel das „Forschungs und Lehrkorpus gesprochenes…
von
In großen metallenen Lettern steht es über dem Portal des Berliner Reichstages: Dem deutschen Volke. Hinter der Fassade verhandelt ein modernes Parlament, der Deutsche Bundestag, die Geschicke ebenjenes Volkes. Seit genau 70 Jahren gibt es…
von
Der Fachinformationsdienst (FID) Linguistik bietet empirisch arbeitenden Sprachwissenschaftler:innen Zugriff auf rund 80 lizenzpflichtige mono- und multilinguale Textkorpora der European Language Resource Association (ELRA).Das Angebot richtet sich an Angehörige einer Universität oder außeruniversitären Forschungseinrichtung innerhalb Deutschlands;…
von
Rhapsodie: a prosodic and syntactic treebank for spoken French This monograph describes the development of Rhapsodie, a 33,000-word syntactic and prosodic treebank of spoken French created with the aim of modeling the interface between prosody,…
von
„MADAR (Multi-Arabic Dialect Applications and Resources) is a three-year joint project among the NLP Group at Carnegie Mellon University in Qatar (CMU-Q), the Computational Approaches to Modeling Language (CAMEL) Lab at New York University Abu…
von
„The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the…