Sprache und Zukunft
Schreiben, reden und schweigen: Entwicklungsszenarien | Cerstin Mahlow
Thema c Predictive Texting, Textgenerierung und Chatbots: Der Computer als (Ko-)Autor
Aufgabe 1 | Predictive Texting: Ergänzungs-Challenge [10']
Testen Sie, wie gut predictive texting funktioniert: Lassen sich damit immer sprachlich korrekte und sinnvolle Texte erzeugen? Starten Sie in einer Gruppe aus mind. 3 Personen eine «Ergänzungs-Challenge» und schreiben Sie jede/r für sich eine Nachricht in WhatsApp oder einem anderen Kurznachrichtendienst, der Wortvorschläge anbietet: Alle beginnen mit denselben vier vorgegebenen Wörtern eines Satzanfangs und wählen dann jeweils den ersten/obersten Vorschlag für das nächste Wort aus. Vergleichen Sie Ihre Sätze. Wie ähnlich sind die so produzierten Sätze? Woran könnten Unterschiede liegen?
Aufgabe 2 | Chatbots: Von ELIZA zu chatGPT [20']
Chatbots sind Maschinen, die auf Fragen oder Äusserungen von Menschen reagieren. Man kann sich mit ihnen «unterhalten». Die zugrundeliegende Technologie ist unterschiedlich, nicht immer merkt man sofort, dass das Gegenüber nur eine Maschine ist.
Testen Sie einen chatbot, der in den 1960er Jahren von Josef Weizenbaum entwickelt wurde.
- ELIZA auf englisc: http://www.med-ai.com/models/eliza.html
- ELIZA auf deutsch http://www.med-ai.com/models/eliza.html.de
Woran merken Sie, dass Sie sich mit einer Maschine unterhalten?
Probieren Sie dann einen chatbot, der mit aktuellster Sprachtechnologie arbeitet, z.B. ChatGPT von OpenAI https://chat.openai.com/chat (Sie können Ihren Google-Account dafür benutzen oder ein Benutzungskonto anlegen). Führen Sie «Unterhaltungen» in verschiedenen Sprachen, wechseln Sie innerhalb einer Unterhaltung die Sprache. Woran merken Sie, dass Sie sich mit einer Maschine unterhalten? Was sind die grössten Unterschiede zu ELIZA?
Aufgabe 3 | Leichte Sprache: Übersetzen oder generieren? [10']
Man könnte die Umformung von Behördentexten in Texte in leichter Sprache als Übersetzung auffassen oder als Generierung von Texten ausgehend von den notwendigen Fakten. Wodurch unterscheiden sich die beiden Herangehensweisen? Schauen Sie sich zum Beispiel die Webseite des Büros für Leichte Sprache Pro Infirmis an: (http://www.buero-leichte-sprache.ch) und suchen Sie nach anderen Angeboten oder Erklärungen.
Das Büro für Leichte Sprache Pro Infirmis (www.buero-leichte-sprache.ch) bietet einen solchen Service an: Texte werden auf Verständlichkeit entsprechend Sprachstufen geprüft durch Personen, die die Sprache im Zielniveau beherrschen. Und Texte werden in leichte Sprache übersetzt. Hier wird ganz klar von «Übersetzen» gesprochen. Ausgangstext ist ein «normaler» Text, Zieltext ist der Text in leichter Sprache.
Das Generieren von Texten in leichter Sprache (genauer: in einer leichten Version einer natürlichen Sprache) ausgehend von Daten und Fakten, ist genauso schwierig oder einfach wie das Generieren von Texten in einer Standardversion einer natürlichen Sprache: Je regelhafter und strukturierter die benötigten Texte sind, desto einfacher ist das. Wetterberichte und Fußballspielreportagen zum Beispiel. Das Generieren von Gedichten oder ganz neuartigen Informationsblättern ist dagegen schwierig. Dann ist es sinnvoller, einen guten Quelltext zu formulieren, diesen automatisch übersetzen zu lassen und diese Übersetzung dann noch nachzubearbeiten. Oder direkt Menschen für die Übersetzung anzufragen.
Aufgabe 4 | Textgenerierung: Chancen und Risiken [20']
Mit moderner Sprachtechnologie lassen sich Texte automatisch generieren. In dieser Aufgabe nehmen Sie die Perspektive von Journalist:innen ein und denken über Konsequenzen von automatischer Textgenerierung nach. Lesen Sie Einschätzungen zu und Beispiele von automatisch generierte journalistischen Texten:
https://www.theguardian.com/commentisfree/2020/sep/08/robot-wrote-this-article-gpt-3 und
https://www.newyorker.com/magazine/2019/10/14/can-a-machine-learn-to-write-for-the-new-yorker
Diskutieren Sie in der Gruppe: Gibt es durch automatisch generierte Texte mehr Chancen für journalistische Arbeit oder mehr Gefahren?
Aufgabe 5 | ChatGPT: Ausprobieren, wie es schreibt [20']
Mittlerweile ist automatische Textgenerierung für jede:n zugänglich. In dieser Aufgabe erkunden Sie Textgenerierung systematisch. Lesen Sie den Beitrag von Philipp Wampfler «Automatische Texte mit GPT-3: Das Ende der Aufsatzdidaktik»:
https://schulesocialmedia.com/2021/11/29/automatische-texte-mit-gpt-3-das-ende-der-aufsatzdidaktik/
Probieren Sie den dort verlinkten Service aus, Sie können sich mit Ihrem Google-Account anmelden, dann «personal use» auswählen und hier etwas aussuchen:
https://beta.openai.com/examples.
Testen Sie die Möglichkeit, die wichtigsten Aspekte für Begriffe und Konzepte oder Erklärungen generieren zu lassen:
https://beta.openai.com/playground/p/default-study-notes?model=text-davinci-002
Erhöhen Sie die «maximum length» auf etwa 2000, belassen Sie die anderen Einstellungen. Dann sollte es etwa so aussehen:
Quelle: Screenshot von https://beta.openai.com/playground/p/default-study-notes?model=text-davinci-002 mit den genannten Einstellungen, 30.4.2021
Verwenden Sie zum Beispiel diese Fragen:
- Was ist Korpuslinguistik und warum ist es wichtig?
- Was sind die 7 wichtigsten Schritte in der Korpusanalyse?
- Erkläre ein Beispiel für die Verwendung von Korpusanalyse beim Übersetzen!
- Erklären ein Beispiel für die Verwendung von Korpusanalyse in der Organisationskommunikation!
Vergleichen Sie, ob Sie jeweils die gleichen Antworten erhalten! Probieren Sie auch, die gleiche Frage in verschiedenen Sprachen zu stellen, z. B. Englisch und Französisch. Sind die Antworten Übersetzungen voneinander?
Wie gut eignen sich die Antworten, wenn diese Anfragen Prüfungsfragen in einer mündlichen Prüfung wären?
Wie gut eignen sich diese Antworten für jemanden, der/die sich (noch) nicht mit Angewandter Linguistik beschäftigt hat?
Probieren Sie alle Schritte auch mit ChatGPT (siehe Aufgabe 2) aus. Unterscheiden sich die Texte, die Sie erhalten? Woran könnte das liegen?
Beispielausgaben für die 4 Anfragen an GPT-3 im Playground. Die erste auch auf französisch und englisch.
Wichtig: für die gleiche Anfrage in verschiedenen Sprachen sind die Antworten nicht einfach Übersetzungen voneinander, es wird jeweils eine neue Antwort erzeugt.
Beispiellösungen für die anderen Fragen: