«La hausse d’efficacité de 30 à 50 % promise n’est pas attestée»


D’après les résultats fournis par l’étude FOCUS de la FSEA, l’intelligence artificielle est pour le moment avant tout utilisée par les fournisseurs de formation continue pour planifier leurs offres ainsi que pour créer des ressources pédagogiques. Découvrez dans cet entretien les projections de l’experte Cerstin Mahlow.

Les résultats de l’enquête menée auprès des prestataires de formation continue en 2024 ont révélé que l’intelligence artificielle était jusqu’à présent surtout utilisée, dans le monde de l’enseignement et de l’apprentissage, pour créer des ressources pédagogiques ainsi que pour planifier les offres de formation (état printemps 2024). Dans quels domaines de l’enseignement et de l’apprentissage voyez-vous le plus grand potentiel?
Aujourd’hui, on utilise souvent le terme «IA» comme synonyme d’«intelligence artificielle générative», et on assimile très souvent cette dernière à ChatGPT. Avec cette application, OpenAI a rencontré un vif succès, et de nombreuses personnes ont alors eu envie ne serait-ce que de tenter l’expérience une fois. Le nom du produit développé par OpenAI est donc aujourd’hui utilisé pour désigner la technologie: en linguistique, on appelle ce phénomène «antonomase». C’est ce qu’il s’est passé avec Google ou Bostitch également, par exemple. ChatGPT est tout simplement un agent conversationnel, ou «chatbot» en anglais, qui essaie de dialoguer avec les êtres humains. Il s’agit d’une technologie qui peut bien sûr aussi être utilisée pour enseigner ou apprendre, puisqu’elle met à notre disposition un interlocuteur infatigable, disponible à toute heure, capable de vérifier quatre fois, cinq fois, six fois s’il le faut, et ce sans la moindre empathie, que mon ébauche de texte correspond bien aux exigences requises. Cela fonctionne tout autant avec une analyse qu’avec un business plan ou un programme de formation continue à l’état de brouillon. On l’oublie parfois, mais les feedbacks des apprenants et apprenantes que l’on récolte au moyen d’évaluations sur la formation sont automatisés depuis fort longtemps, et avec succès. Les questionnaires à choix multiple, les textes à trous et les éléments à assembler, peu importe qu’il s’agisse de textes ou de zones d’image, sont quant à eux évalués automatiquement depuis longtemps également, et les personnes apprenantes reçoivent un feedback ou une assistance adaptés une fois l’évaluation automatique effectuée. Les nouveaux modèles d’IA permettent simplement d’accélérer quelque peu ce processus. En outre, ces exercices sont plus «généreux», par exemple en ce qui concerne l’orthographe ou bien si des phrases entières doivent être formulées, ce genre de choses. Ça va donc plus loin que de simples questions où l’on doit cocher les réponses: on peut entrer librement du texte qui devra être lu et analysé par quelqu’un afin de voir si la réponse donnée va dans la bonne direction.

L’enquête menée par la FSEA auprès des prestataires de formation continue montre que la plupart des fournisseurs ne donnent aucune consigne ou directive concernant l’utilisation ou non de l’IA générative et concernant la façon dont elle doit le cas échéant être utilisée. Or, d’après les études et enquêtes menées sur le sujet, quand les consignes manquent ou quand les consignes données sont plutôt vagues, certaines personnes ont tendance à ne pas utiliser un outil, tout simplement pour éviter l’incertitude. Pour cette raison, j’ai pour ma part tendance à penser que si les fournisseurs de formation continue étaient plus nombreux à échanger avec leurs collaborateurs et collaboratrices ainsi qu’à établir avec elles et eux des directives de qualité, alors ces outils seraient davantage utilisés. On associe souvent la «création de ressources pédagogiques» à une mission relevant du personnel enseignant. Pourtant, les personnes apprenantes peuvent elles aussi créer des ressources additionnelles, qu’il s’agisse de scénarios en plus leur permettant de reconnaître certaines actions ou de s’entraîner sur certaines actions, de textes à trous ou d’exercices de compréhension écrite supplémentaires, d’exercices de calculs statistiques en plus, etc. Il s’agit de ressources similaires à celles que leur proposent leurs professeurs. Souvent, quand quelqu’un recherche une offre de formation continue, il se pose du reste les questions suivantes: qu’est-ce qui m’intéresse personnellement, et qu’est-ce qui me convient le mieux compte tenu des connaissances dont je dispose déjà, du temps que je peux consacrer à une formation, etc.? Ici aussi, l’IA peut apporter une aide en arrière-fond en proposant des suggestions adaptées. Ce qui est impératif ici, à l’image de ce qu’il se passe également pour les évaluations ou tests, c’est que tout cela reste des propositions: la personne doit être libre de les refuser. Le processus ne doit donc pas conduire à ce que, lorsque j’arrive dans un nouvel organisme, je passe une série de tests puis je me retrouve dans l’obligation de suivre une ou deux formations continues.

Ce que les fournisseurs attendent principalement de l’IA, c’est de pouvoir individualiser l’enseignement et l’apprentissage. Or, la pratique révèle que l’IA est pour le moment plutôt utilisée pour réduire le temps de travail, et que les attentes liées à l’individualisation n’ont été que partiellement remplies. Comment analysez-vous ce résultat?
La réduction de 30, 50 voire 70 % du temps de travail que l’on nous promettait souvent au début pour tous les domaines n’est pas attestée. Toutes les nouvelles vagues d’apparition de nouvelles technologies s’accompagnent de telles promesses, qui ne se réalisent pas par la suite, comme l’atteste entre autres une étude canadienne qui portait cependant précisons-le sur les systèmes d’IA d’avant 2022. Peu de choses sont automatisables dans l’enseignement et l’apprentissage. Pour évaluer des questionnaires à choix multiples, ça fonctionne par exemple, mais créer des questionnaires à choix multiples de qualité demande quand même un certain temps. Créer plusieurs scénarios similaires à partir d’un scénario donné en appuyant sur un bouton fonctionne également, mais il ne s’agit toujours pas d’une individualisation à proprement parler. Individualiser l’enseignement et l’apprentissage requiert davantage de travail, et de travail de réflexion en particulier. Les idées et ressources que l’on peut générer grâce à l’IA doivent être contrôlées et ajustées si besoin, or cela demande du temps également. Dans l’ensemble, on peut dire qu’intégrer l’IA générative dans les processus modifie le travail, peu importe qu’il s’agisse de générer des textes, des images ou du son. Parce qu’en utilisant l’IA générative, je peux utiliser le temps dont je dispose pour faire des choses plus créatives, pour tester différentes options, puis pour obtenir très vite un premier brouillon qui me permettra de vérifier que la direction dans laquelle je me suis engagée est prometteuse. Mais, au bout du compte, j’aurai alors passé autant de temps sur mon travail: j’aurai simplement utilisé ce temps autrement. La hausse d’efficacité de 30 à 50 % qui nous a été promise n’est donc pas attestée, même si certaines choses nous semblent aller plus vite et sont ensuite présentées comme un gain de temps. Pour individualiser son offre, un fournisseur de formation continue doit connaître foule de détails sur les personnes susceptibles de participer à ses formations. Au sein même de l’organisme, cela est possible, car on sait que telle personne occupe tel poste spécifique et a tel profil spécifique, etc. L’individualisation, dans ce cas, peut passer par l’intégration optimale de nouvelles informations ou de nouvelles opportunités de formation dans la routine professionnelle journalière de cette personne, c’est-à-dire par le fait de ne rendre certaines offres disponibles ou de ne les proposer activement que lorsqu’une fenêtre de temps particulière s’ouvre chez cette personne. On tombe cela dit alors très vite dans la surveillance et le contrôle. Les personnes susceptibles de participer à une formation sont donc tenues de chapeauter un grand nombre de choses par elles-mêmes, de demander ou d’indiquer activement certaines choses, par exemple le temps dont elles disposent à l’instant T, et pour quoi faire. L’approche serait dans une telle situation certes individualisée, mais demanderait dans le même temps beaucoup de temps et d’énergie, et par-dessus tout une culture différente de celle à laquelle on est habitué et dans laquelle on vit actuellement. En dehors de tels contextes, un fournisseur de formation continue qui souhaiterait individualiser son offre doit soit émettre de nombreuses hypothèses sur la personne qu’il vise, laquelle sera ensuite tenue de les confirmer ou corriger, soit déduire un grand nombre de choses très rapidement à partir des premières interactions avec cette personne (que ces interactions aient lieu de manière automatisée ou bien sous la forme de retours de la personne), puis doit intégrer toutes ces données en direct si l’on peut dire dans les étapes suivantes de l’aménagement de son offre. Tout ça est loin d’être un exercice trivial et demande beaucoup de travail. Une solution alternative serait de préparer une grande quantité d’offres, lesquelles se démarqueraient facilement et permettraient ainsi aux personnes intéressées de choisir l’offre idéale pour leur profil. On garantirait de cette manière l’existence d’une formation appropriée pour tout le monde, mais une telle solution nécessiterait un grand travail préparatoire, et chaque offre ainsi programmée de A à Z ne serait demandée que très rarement et par un faible nombre de personnes. Du point de vue du fournisseur, le jeu n’en vaut donc pas la chandelle non plus. Dans les années 2000 déjà, un grand nombre de projets de recherche et de changements avaient conduit à découper les offres d’enseignement et de formation continue en très petits modules. Le découpage n’était pas effectué au niveau des cours: on allait jusqu’à segmenter certaines leçons en petits éléments que l’on rassemblait ensuite automatiquement selon les besoins et les connaissances préalables des apprenants et apprenantes. Avec cette méthode, l’introduction au sujet et les exercices donnés peuvent être proposés à différents niveaux. Mais la production de ces éléments de petite taille pour divers niveaux nécessite beaucoup de temps et d’argent. L’échec final de ces projets de modularisation est à imputer à deux facteurs: premièrement, aux coûts de production importants de chacun de ces éléments d’enseignement ou d’apprentissage, que l’on doit aux exigences élevées attendues des personnes concevant les ressources pédagogiques et didactiques, et, deuxièmement, au fait que l’on ne sait toujours pas comment rassembler concrètement en direct ces éléments pour qu’ils forment un ensemble pertinent et cohérent pour le personnel enseignant comme pour les personnes apprenantes. Les systèmes d’IA actuels pourraient certes aider concernant le dernier point, mais cet assemblage final ne représente pas la majeure partie du temps requis par ces processus.

Les organismes de formation continue suisses utilisent pour le moment surtout des outils spécialisés dans le traitement du langage, comme ChatGPT, DeepL, Gemini ou encore Copilot. Quelle est selon vous la plus-value des autres types d’applications basées sur l’IA (comme les systèmes de recommandation ou les systèmes d’évaluation automatique) pour la formation continue?
Nous prendrons nos distances, au cours des prochains mois, avec les applications spécifiques que nous utilisons comme outils complémentaires. L’IA générative est désormais bien intégrée dans les applications les plus connues et les plus couramment utilisées. Elle y est tout simplement proposée comme fonction supplémentaire que l’on peut ouvrir ou qui s’ouvre d’elle-même sans aucune action spécifique de notre part. Les programmes de contrôle linguistique tels que Grammarly ou Antidote (que l’on peut intégrer à Word voire dans toutes les applications de son ordinateur) utilisent déjà l’IA générative pour leurs suggestions d’amélioration ainsi que pour les exemples qu’ils fournissent. DeepL peut être intégré à divers programmes de la même façon. Quand on écrit quelque chose dans MS Teams (qu’il s’agisse d’un simple message ou bien d’un exercice de cours), l’éditeur du logiciel propose de lui-même d’améliorer notre texte. Si on ne souhaite pas utiliser cette option, il est très difficile voire impossible de la désactiver. La même chose va se produire dans les programmes qui hébergent nos e-mails, dans PowerPoint, etc. Non seulement pour le texte, mais aussi pour l’organisation des slides, des graphiques ou encore pour le choix des couleurs. Adobe propose la même chose dans ses produits: diverses fonctions utiles basées sur l’IA s’y ouvrent en permanence partout. Ce que l’on a pu démontrer il y a quelques décennies concernant les programmes de vérification orthographique ou grammaticale va se produire à nouveau: certains utilisateurs et certaines utilisatrices ignoreront (ou seront en mesure d’ignorer) ces suggestions, et quelques personnes désactiveront même (ou seront en mesure de désactiver) l’étape de vérification, et par conséquent les suggestions proposées. La majeure partie des gens adaptera toutefois ses textes de sorte que plus aucun détail ne puisse leur être reproché. Ainsi, la créativité disparaîtra, on ne jouera plus avec le vocabulaire pour se l’approprier et le résultat sera une uniformisation générale. On observe le même phénomène avec les textes et les images générés par l’IA: ils et elles se ressemblent toutes et tous d’une certaine manière. Souvent, on est incapable de dire exactement ce qui nous déplaît, mais on développe une sorte d’intuition dès lors qu’on est suffisamment attentif. Cette faculté que nous avons de distinguer les textes et les images générés par l’IA va cependant disparaître à mesure que le nombre de textes et d’images (ainsi que de sons et de vidéos) générés automatiquement augmentera. Nous finirons par nous adapter, et même par nous définir et nous construire de la sorte. S’agira-t-il alors d’une plus-value? Cela dépendra de la configuration et du but visé. Aura-t-on besoin de se conformer à certaines lignes directrices ou à certains documents, films, etc. produits antérieurement pour définir et créer ce que nous souhaitons? Le fait que certaines discussions se déroulent toujours de façon structurée et selon le même schéma sera-t-il important? Si la réponse est oui, alors l’IA générative telle qu’on la connaît actuellement sera bien sûr d’une grande aide, car je pourrai étudier les textes, processus, etc., standardisés et me faire aider dans cet apprentissage. En revanche, si, en tant que personne, qu’organisme de formation ou qu’entreprise, je suis à la recherche d’une chose d’inhabituelle, d’une chose qu’aucune autre personne n’a encore testée avant moi, alors l’IA générative actuelle ne m’aidera d’aucune manière. Ou alors si, mais en me montrant ce qu’il ne faut pas faire parce que tout le monde procède déjà comme ça.

Cerstin Mahlow est professeure de linguistique numérique et de recherche en processus d’écriture à la Haute école des sciences appliquées de Zurich (ZHAW). Linguiste informaticienne de formation, ses recherches portent sur la modélisation linguistique systématique des données empiriques provenant des processus d’écriture, ainsi que sur la façon dont les outils dits intelligents influencent l’écriture. Responsable des textes «CAS» de la ZHAW, Cerstin Mahlow propose deux fois par an avec ses collègues un cours de formation continue intitulé «l’IAG générative dans l’enseignement et la formation continue».