Weiterbildungsanbieter setzen KI bisher vor allem für die Angebotsplanung und für die Lernmaterialien ein, das zeigt die FOCUS-Studie des SVEB. Expertin Cerstin Mahlow schätzt ein.
Die Resultate der Anbieterumfrage 2024 haben gezeigt, dass KI in den Lehr-/ Lernsettings bisher primär bei der Erstellung von Lernmaterialien und bei der Angebotsplanung genutzt wird (Stand Frühling 2024). In welchen Bereichen des Lehr-/Lernsettings sehen Sie das grösste Potenzial?
Momentan wird «KI» oft synonym zu «generative KI» gebraucht und das wiederum sehr oft mit «ChatGPT» gleichgesetzt. OpenAI war mit seiner Anwendung einfach sehr erfolgreich und hat viele mindestens verführt, das einmal auszuprobieren. Der Produktname wird gebraucht, wenn die Technologie gemeint ist: «generische Verselbständigung» nennt die Linguistik das, so wie bei Google oder Bostitch. ChatGPT ist einfach ein Chatbot, der versucht, das menschliche Gegenüber im Dialog zu halten. Und natürlich kann man das auch in Lehr-/Lernsettings benutzen – man hat einen unermüdlichen, ständig verfügbaren Gesprächspartner, der völlig ohne Empathie auch noch ein viertes, fünftes, sechstes Mal checkt, ob mein Textentwurf den geforderten Ansprüchen genügt. Egal, ob es um eine Analyse geht, einen Businessplan, einen Weiterbildungsentwurf. Was etwas vergessen geht: Feedback zum Lernen in formativen Assessments wird schon sehr lang und auch erfolgreich automatisiert. Multiple-Choice-Fragen, Lückentexte, Zuordnungen – egal, ob Text oder Bildbereiche – werden schon lang automatisch ausgewertet und die Lernenden erhalten entsprechend Feedback oder Hilfestellungen. Das geht mit den neuesten KI-Modellen einfach noch ein wenig schneller. Und diese Aufgaben sind dann etwas «grosszügiger», was zum Beispiel Rechtschreibung angeht oder ob man ganze Sätze formulieren muss etc. Das geht also über einfache Ankreuz-Fragen hinaus: Man kann frei Text eingeben, den eigentlich jemand lesen und analysieren müsste, ob die Antwort in die richtige Richtung geht. Die Anbieterumfrage des SVEB zeigt, dass die meisten Anbieter keine Vorgaben machen oder Richtlinien zur Verfügung stellen, ob und wie generative KI eingesetzt werden kann. Was sich in Studien und Umfragen zeigen lässt: Wenn es keine Vorgaben gibt oder diese recht vage sind, dann neigen manche Personen dazu, etwas eher nicht zu verwenden. Einfach um diese Unsicherheit zu vermeiden. Meine Vermutung wäre daher: Wenn sich mehr Weiterbildungsanbieter mit ihren Mitarbeitenden zusammensetzen und gemeinsam gute Richtlinien erarbeiten, wird auch die Verwendung zunehmen. Typischerweise assoziieren wir die «Erstellung von Lernmaterialien» mit Aufgaben von Lehrpersonen. Aber auch Lernende selbst können sich weiteres Material erstellen lassen: weitere Szenarien, in denen Handlungen geübt oder erkannt werden sollen, weitere Lückentexte oder Leseverständnisfragen, weiteres Material für statistische Berechnungen etc. Die sind dann ähnlich zu dem Material, das Lehrende anbieten. Oft geht es für Personen auf der Suche nach einer Weiterbildung ja auch darum: Was interessiert mich, was passt zu mir – also meinen Vorkenntnissen, meiner verfügbaren Zeit etc. Auch da kann KI im Hintergrund helfen, passende Vorschläge zu machen. Wichtig ist mir hier – wie auch für das Assessment, also Tests – dass es darum gehen muss, Vorschläge zu machen. Der Mensch muss dann immer noch frei sein, sich dagegen zu entscheiden. Es darf also nicht dazu führen, dass ich beim Eintritt in eine neue Organisation einige Tests absolviere und dann ein oder zwei Weiterbildungen absolvieren muss.
Am meisten Nutzen erhoffen sich die Anbieter für die Individualisierung der Lehr-/Lernsettings. In der Praxis zeigt sich aber, dass der Einsatz von KI bisher am ehesten zu Arbeitszeitersparnissen führt, während sich die Erwartungen bei der Individualisierung nur teilweise erfüllen. Wie schätzen Sie dieses Ergebnis ein?
Die anfangs oft versprochene Arbeitszeitersparnis von 30, 50, 70 Prozent in allen Bereichen lässt sich nicht belegen. Solche Versprechungen gibt es mit jeder Welle von neuer Technologie; sie bewahrheiten sich nicht, wie zum Beispiel eine Studie aus Kanada zeigt – auch wenn es dort um KI vor 2022 geht. Nur wenig im Lehren und Lernen lässt sich automatisieren. MultipleChoice-Fragen auswerten, das geht. Aber gute Multiple-Choice-Fragen erstellen kostet eben doch Zeit. Zu einem gegebenen Szenario mehrere weitere ähnliche auf Knopfdruck erzeugen, das geht auch – das ist aber noch keine wirkliche Individualisierung. Dafür ist mehr Arbeit und vor allem mehr Denkarbeit notwendig. Die Vorschläge und Materialien, die man sich mit KI erstellen lassen kann, müssen geprüft und allenfalls angepasst werden – das kostet Zeit. Insgesamt lässt sich sagen, dass sich durch den Einbezug von generativer KI (egal, ob Text, Bild, Ton) das Arbeiten ändert. Ich kann eher Zeit in kreative Dinge investieren, verschiedene Möglichkeiten ausprobieren – und dann sehr schnell einen ersten Entwurf bekommen, um zu prüfen, ob die Richtung vielversprechend ist. Am Ende habe ich genauso viel Zeit investiert, einfach anders. Diese versprochene Effizienzsteigerung von 30 Prozent oder 50 Prozent lässt sich so also nicht belegen. Auch wenn gefühlt manches schneller geht und das dann als Arbeitszeitersparnis angegeben wird. Zur Individualisierung muss ein Weiterbildungsanbieter sehr viel über die Teilnehmenden wissen. Innerhalb der Organisation mag das möglich sein: Eine Person hat einen bestimmten Job mit einem bestimmten Profil etc. Individualisierung kann nun heissen, dass neue Information oder Trainingsmöglichkeiten perfekt in den Arbeitstag eingepasst werden. Also nur zur Verfügung stehen oder aktiv angeboten werden, wenn ein entsprechendes Zeitfenster sich öffnet. Da sind wir aber sehr schnell bei Überwachung und Kontrolle. D.h., die (potenziellen) Teilnehmenden müssten vieles steuern können, aktiv etwas anfordern, selbst angeben, wie viel Kapazität sie gerade wofür haben. Das wäre individuell, aber auch anstrengend und vor allem eine andere Kultur, als wir sie momentan vorfinden und leben. Um Individualisierung ausserhalb dieser Kontexte zu ermöglichen, muss ein Weiterbildungsanbieter entweder sehr viele Annahmen machen, die die einzelne Person dann bestätigen oder übersteuern muss, oder aus den ersten Interaktionen sehr schnell sehr vieles ableiten (egal, ob automatisch oder über Rückmeldungen von Personen) und dies sozusagen live in die weitere Gestaltung einbinden. Das ist nicht trivial und darum auch aufwendig. Alternativ könnte man sehr viele Angebote vorbereiten, die sich leicht unterscheiden und so interessierten Personen erlauben, das wirklich absolut passende Angebot auszuwählen – es gibt für jede, für jeden etwas, garantiert. Aber das bedeutet einen grossen Vorbereitungsaufwand und dann wird jedes einzelne vollständig geplante Angebot nur sehr selten und wenig angefordert. Auch das lohnt sich aus Anbietersicht eigentlich nicht. Bereits in den 2000er Jahren gab es viele Forschungsprojekte und Entwicklungen, Lehr- und Weiterbildungsangebote sehr kleinteilig zu modularisieren – nicht auf Kursebene, sondern sogar einzelne Lektionen in kleine Elemente zu teilen und entsprechend automatisch nach Bedürfnis und Vorkenntnissen zusammenzusetzen. Input und Aufgaben werden auf unterschiedlichen Niveaus angeboten. Die Produktion solcher kleinen Elemente auf verschiedenen Niveaus ist aufwendig und anspruchsvoll. Woran diese Projekte letztlich gescheitert sind, waren zwei Faktoren: die hohen Produktionskosten für einzelne Lehr-/Lernelemente aufgrund der hohen Ansprüche an Autorinnen und Autoren von Lehr-/Lernmaterialien und die ungelöste Frage, wie solche Elemente live so zusammengefügt werden, dass sich für Lernende und Lehrende ein sinnvolles kohärentes Ganzes ergibt. Im letzten Punkt könnte heutige KI helfen; das ist aber nicht der grösste zeitliche Anteil an diesen Prozessen.
In den Schweizer Weiterbildungsorganisationen kommen bisher vor allem auf Sprachverarbeitung spezialisierte Tools wie ChatGPT, DeepL, Gemini und Copilot zum Einsatz. Wie schätzen Sie den Mehrwert von anderen KI-Anwendungen (bspw. Recommendersysteme oder automatische Prüfungssysteme) für die Weiterbildung ein?
Wir werden in den nächsten Monaten wegkommen von spezifischen Anwendungen, die als zusätzliches Tool eingesetzt werden. Generative KI wird jetzt schon in etablierte Anwendungen eingebunden, einfach als zusätzliche Funktion, die man aufrufen kann oder die sich sogar selbst aufdrängt ohne spezifischen Aufruf. Sprachprüfprogramme wie Grammarly und Antidote (die man ja in Word einbinden kann oder sogar in alle Anwendungen auf dem Laptop) verwenden für Verbesserungsvorschläge und Beispiele schon generative KI – wir sehen das gar nicht mehr. DeepL lässt sich genauso einbinden. Schreibt man in MS Teams etwas (egal ob eine Nachricht oder eine Aufgabe in einem Kurs), dann offeriert der Editor von sich aus, das zu verschönern. Möchte man das nicht benutzen, ist es recht schwierig bis unmöglich, diese Funktionen zu deaktivieren. Wir werden das auch sehen in Mail-Programmen, PowerPoint etc. Und dort nicht nur für Text, sondern auch für die Gestaltung der Folien und Grafiken, für die Auswahl der Farben. Das Gleiche macht Adobe in seinen Produkten: immer und überall poppen hilfreiche KI-Funktionen auf. Was man vor Jahrzehnten bei Rechtschreib-/Grammatikprüfprogrammen zeigen konnte, wird auch hier auftreten: Es gibt Benutzerinnen und Benutzer, die diese Vorschläge ignorieren (können); es gibt einige wenige, die die Prüfung und damit Vorschläge abstellen (können). Die Mehrheit passt das eigene Schreiben so an, dass nichts mehr bemängelt wird. Damit ist Kreativität weg, ist spielerischer Umgang mit Begriffen weg, wir enden in der Gleichförmigkeit. Genau das sieht man in KI-generierten Texten und Bildern: Sie ähneln sich alle irgendwie. Wir können oft nicht genau sagen, was uns missfällt, aber wir entwickeln ein Gespür – wenn wir aufmerksam genug sind. Diese Unterscheidbarkeit wird aber wegfallen, je mehr generierte Texte und Bilder (auch Töne und Videos) um uns herum sind. Wir werden uns anpassen und auch selbst so formulieren, so gestalten. Ob das ein Mehrwert ist, hängt vom Setting und vom Zweck ab. Kommt es darauf an, gemäss Vorgaben und einheitlich zu früheren Dokumenten, Filmen etc. zu formulieren und zu gestalten? Ist es wichtig, dass Gespräche immer strukturiert nach einem gleichen Schema ablaufen? Dann hilft die aktuelle generative KI natürlich enorm: Ich kann diese Standard-Texte, Standard-Abläufe etc. lernen und mir dabei helfen lassen. Bin ich als Person oder als Organisation oder Firma auf der Suche nach dem Ungewöhnlichen, nach dem, was bislang noch niemand probiert hat, dann hilft heutige generative KI nicht. Oder doch: Ich sehe, was ich nicht machen sollte, weil alle anderen es so machen.
Cerstin Mahlow ist Professorin für Digitale Linguistik und Schreibprozessforschung an der Zürcher Hochschule für Angewandte Wissenschaften. Als Computerlinguistin konzentriert sie sich in ihrer Forschung auf die systematische linguistische Modellierung von empirischen Daten aus Schreibprozessen und untersucht den Einfluss von intelligenten Werkzeugen auf das Schreiben. Sie verantwortet den CAS Texten der ZHAW und bietet mit Kolleginnen und Kollegen zweimal jährlich einen Weiterbildungskurs, «Generative KI in Lehre und Weiterbildung», an.