von
Das „Schweizerische Idiotikon“ – oder auch „Wörterbuch der schweizerdeutschen Sprache“ – dokumentiert in 17 Bänden 150.000 Wörter aus 700 Jahren … … der deutschen Sprache in der Schweiz vom Spätmittelalter bis in die Gegenwart, die älteren…
von
Im Rahmen der Språkbanken wurde eine morphologische Datenbank veröffentlicht, in der über 16.000 Wörter aus zwei Korpora anhand ihrer morphologischen Bestandteile annotiert wurden: The CoDeRooMor dataset (version 1.0) contains 16 230 lemgrams generated from COCTAILL…
von
Der Verbund Text+ wird text- und sprachbasierte Forschungsdaten langfristig erhalten und ihre breite Nutzung in der Wissenschaft ermöglichen. Die Gemeinsame Wissenschaftskonferenz hat Text+ als Konsortium der bundesweiten Initiative zum Aufbau einer nationalen Forschungsdateninfrastruktur (NFDI) bewilligt. Text+ startet…
von
Das ZDL wurde Anfang 2019 eingerichtet. Es hat … … zum Ziel, die deutsche Sprache in Gegenwart und Geschichte umfassend und wissenschaftlich verlässlich zu beschreiben. In Form dieses Portals bietet es Zugriff auf umfangreiche gegenwartssprachliche…
von
Mit der „Språkbanken“ wird in Schweden eine nationale Infrastruktur für Sprachdaten aufgebaut: Neben Korpora mit schwedischen Texten werden Tools zur Annotation und Analyse von Texten angeboten; das Team der Språkbanken betreibt zudem auch eigene Forschung…
von
Die Språkbanken, eine Sammlung sprach(wissenschaft)licher Ressourcen der Uni Göteborg, wurde ergänzt um das Korpus „sv-COVID-19“ zur Dokumentation der sprachlichen Neuerungen durch die Corona-Pandemie: Die – weiter wachsende – Sammlung umfasst Texte von schwedischen Websites, Blogs…
von
LAUDATIO (Long-term Access and Usage of Deeply Annotated Information) ist ein Forschungsdaten-Repository für historische Korpora. Derzeit stehen 24 Korpora zur Verfügung. Interessierte Nutzer:innen können in den Dokumenten und TEI-Annotationen suchen, die Korpora anzeigen lassen oder…
von
The Endangered Languages Archive (ELAR) is a digital repository for preserving multimedia collections of endangered languages from all over the world, making them available for future generations. ELAR’s mission is to: – provide a safe…
von
Das Korpus umfasst eine annotierte Sammlung der ältesten deutschen Sprachdenkmäler. Mit der Initiative „Deutsch Diachron Digital“ wurde über viele Jahre das Ziel verfolgt, für die Erforschung der Sprachgeschichte des Deutschen tiefenannotierte Korpora auf der Höhe…
von
The Freiburg Corpus of English Dialects (FRED) is a monolingual spoken-language database of traditional English dialects. It samples approximately 2.5 million words and is estimated to be based on about 300 hours of recorded speech.…