Séminaire doctoral interuniversitaire en Sciences du langage

Arnaud Vincent: "Introduction aux concepts et outils de la linguistique de corpus pour l'analyse de données textuelles"

Description

- Langue de la formation: français

- Niveau:  introduction

- Prérequis: aucun

- Domaine concerné: Sciences sociales et humaines

- Public concerné: Toute chercheuse/tout chercheur souhaitant analyser des corpus de textes

- Programme informatique principalement utilisé: Lancsbox (gratuit et libre)

- Les points suivants seront notamment abordés:

  • Situer la linguistique de corpus dans le paysage du Big Data, des Digital Humanities et du Text Mining
  • Construction d'un corpus (conseils, précautions, DIY corpora vs ready-made corpora)
  • Collocations
  • Fréquence et dispersion 
  • Concordances
  • Extraction de keywords, N-Grams, key N-grams
  • Détection de "plagiat" entre deux textes et identification d'idiolectes

- Durée: 1 journée de 9h à 16h  

- Inscription obligatoire avant le 20/08/20 - voir "Inscription" ci-dessous

Informations Pratiques

Université Saint-Louis

Boulevard du Jardin botanique 38 (entrer par le parking)

Local D16 (4ème étage)

1000 Bruxelles

Inscription


Pour vous inscrire, veuillez cliquer ici

 

Date limite d'inscription: 20/08/2020

Écrire commentaire

Commentaires: 0