Die Praxis in Sprachberufen untersuchen
Qual der Wahl: Korpora auswählen und zusammenstellen | Dr. Julia Krasselt
Thema b Mehrsprachig, synchron, spezialisiert: Typen linguistischer Korpora
Aufgabe 1 | Mehrsprachig, synchron, spezialisiert: Korpustypen erkennen und zuordnen [25']
Je nach Primärdaten werden unterschiedliche Typen von Korpora unterschieden. Lesen Sie die folgenden Beschreibungen von vier existierenden Korpora durch und entscheiden Sie, um welche Art Korpus es sich jeweils handelt. Begründen Sie ihre Antwort. Beachten Sie, dass es Mehrfachzuordnungen geben kann: Ein Korpus kann etwa sowohl zum Typ ⁄ als auch zum Typ ⁄ gehören).
Korpus 1
Ein Korpus bestehend aus 32 Sprachaufnahmen von Kindern im Primarschulalter aus dem Raum Dresden (Deutschland), die eine der Fremdsprachen Englisch oder Französisch oder Tschechisch lernen. Die Sprachaufnahmen bestehen aus Interviews, die mit den Kindern geführt wurden, nachdem sie die Sprache zwei Jahre lang in der Schule gelernt haben. In den Interviews mussten die Kinder über vertraute Themen sprechen, aber auch über ein ihnen unbekanntes Kinderbuch. Die Interviews liegen als Videoaufnahmen vor und wurden transkribiert.
Korpus 2
Ein Korpus bestehend aus 357 Reden und ihren Simultanverdolmetschungen, die im Europäischen Parlament gehalten wurden, und zwar in Italienisch, Englisch oder Spanisch. Das Korpus enthält Videoaufnahmen der Sprecher*innen, Audioaufnahmen der Dolmetschenden und Transkripte. Einander entsprechende Segmente sind explizit einander zugeordnet.
Korpus 3
Ein Korpus bestehend aus 130.000 deutschen Chatnachrichten aus den Bereichen Freizeit, Beratung, Lernen und Lehren, Zeitraum: 2000-2006.
Korpus 4
Ein Korpus bestehend aus geschriebenem und gesprochenem britischem Englisch. Die Texte stellen einen repräsentativen Querschnitt durch das britische Englisch des 20. Jahrhunderts dar. Sie stammen aus Belletristik, Zeitungen, Briefen,
Korpus 1
Lernendenkorpus (Sprachaufnahmen von Kindern, die eine Fremdsprache lernen),
multimodales Korpus (transkribierte Audioaufnahmen),
mehrsprachiges Korpus (Aufnahmen in drei verschiedenen Sprachen).
Beim hier beschriebenen Korpus handelt sich um das Dresden Corpus
https://slabank.talkbank.org/access/Czech/Dresden.html
Korpus 2
mehrsprachiges Korpus (Reden in drei verschiedenen Sprachen),
multimodales Korpus (transkribierte Audioaufnahmen),
Parallelkorpus (Zuordnung einander entsprechender Segmente in Simultanverdolmetschungen).
Beim hier beschriebenen Korpus handelt es sich um das EPIC Corpus:
http://catalog.elda.org/en-us/repository/browse/ELRA-S0323/
Korpus 3
schriftsprachliches Korpus (Chatkommunikation),
einsprachiges Korpus (deutsche Chat-Mitschnitte),
synchrones Korpus (Zeitraum von 6 Jahren)
Beim hier beschriebenen Korpus handelt es sich um das Dortmunder Chatkorpus 2.0:
https://vlo.clarin.eu/record/http_58__47__47_hdl.handle.net_47_10932_47_00-033B-0995-19D0-0A01-B?4)
Korpus 4
schriftsprachliches und gesprochensprachliches Korpus,
einsprachiges Korpus (britisches Englisch),
synchrones Korpus (20. Jahrhundert),
Referenzkorpus (umfassendes Sampling des britischen Englisch)
Beim hier beschriebenen Korpus handelt es sich um das British National Corpus:
http://www.natcorp.ox.ac.uk