Conférence : Usage des corpus au service de l'apprentissage des langues étrangères : le projet CEFRLex

Intervention de Thomas François - UCLouvain

Résumé :

La linguistique de corpus est un courant empirique qui s’est considérablement développé  depuis les années 70, en particulier en conjonction avec les avancées technologiques en informatique et dans le domaine du traitement automatique du langage. Le recours à des corpus permet en effet de confronter les modèles théoriques basés sur la compétence avec la réalité de la langue telle qu’elle est parlée. Dans le cadre de l’apprentissage des langues, les corpus de données d’apprenants ou pour apprenants permettent de mieux se représenter l’état réel de l’interlangue des apprenants en fonction des différents stades d’évolution.

 

Une des pratiques les plus communes dans ce domaine est de construire des listes lexicales à partir de corpus dans le but de mieux définir des objectifs d'apprentissage au sein des programmes d'enseignement des langues étrangères. Plusieurs approches ont été mises à profit pour créer de telles listes: (1) estimer les fréquences des mots à partir d'un large corpus de textes authentiques à destination de lecteurs natifs (ex. Kucera & Francis, 1967; Baayen et al., 1993; Brysbaert & New, 2009), (2) se baser sur les connaissances d'experts en didactique des langues, comme c'est le cas pour les référentiels pour le CECR (ex. Niveau B1 pour le français de Beacco et al., 2011), ou (3) chercher à inférer automatiquement une liste de mots graduée à l'aide d'algorithmes statistiques (ex. Brooke et al., 2012).

 

Dans le cadre du projet international CEFRLex, nous avons adopté une approche originale pour constituer des ressources lexicales destinées à soutenir l'apprentissage des langues étrangères. Ces ressources décrivent les distributions de fréquence de milliers de mots sur l'échelle du CECR (allant de A1 à C2) dans plusieurs langues européennes (le français, l'anglais, le suédois, le néerlandais et l'espagnol). Ces distributions de fréquence sont obtenues à partir d'un corpus de textes pédagogiques pour l'enseignement des langues étrangères (manuels et livres simplifiés) ou des données d’apprenants. Les ressources ainsi produites ont ensuite été vérifiées manuellement et sont disponibles gratuitement à des fins de recherche sous un format électronique. Elles sont également consultables en ligne via une interface destinée aux apprenants et aux professeurs de L2. Dans cette communication, nous présenterons les fondements théoriques et les objectifs du projet CEFRLex ainsi que la méthodologie utilisée pour construire les ressources. Nous discuterons ensuite des avantages de ce type de ressources pour l'enseignement et la recherche sur les langues étrangères. Nous ferons enfin une démonstration de la nouvelle interface web dédiée au projet CEFRLex, qui permet de comparer des mots au sein d'une même ressource, mais aussi entre différentes langues.


Cette conférence est organisée par le SeSLa (entrée libre).

Informations pratiques :

Local P50, 10h30-12h30

Université Saint-Louis - Bruxelles

Boulevard du jardin Botanique, 43

1000 BRUXELLES

 

Renseignements : anne.dister@usaintlouis.be

Accès

Écrire commentaire

Commentaires: 0