Module transversal "Traitement Automatique des Langues"
UE4-UE6 ou complément de formation

L2 semestre 4, L3 semestres 5 et 6

Le module transversal TAL est un parcours de L2 S4 et L3 S5 et S6 porté par la licence ""Sciences Humaines et Sociales"", mention "Sciences du Langage". Il peut être choisi comme UE4 et UE6 réunies ou comme complément de formation.

Il est géré par l’UFR de Lettres modernes et est articulé, depuis la création de la formation qui le précédait en 2000, aux recherches en sciences du langage menées à l’UMR STL (Unité Mixte de Recherche du CNRS "Savoirs, Textes, Langage", ex-UMR SILEX - "Syntaxe, Interprétation, LEXique").

À qui s'adresse cette formation ?

Le module transversal TAL s’adresse à tous les étudiants qui sont désireux de mettre le langage au cœur de leurs activités de recherche ou professionnelles, et qui veulent aborder celles-ci avec les techniques modernes de l’outillage informatique, ou développer de nouveaux outils de traitement automatique des langagues.
A tous ceux qui se destinent à une large gamme d’activités, allant de la linguistique fondamentale ou appliquée au développement de produits multimédias, en passant par la lexicographie, la terminologie, la traduction automatique ou assistée par ordinateur, l'élaboration d'outils de navigation, la didactique outillée des langues ou les métiers de l’édition, le parcours TAL apporte des connaissances de base en matière de description et de formalisation linguistiques et d'appropriation théorique et pratique d'outils informatiques impliqués dans le traitement des langues, des textes et des connaissances.
À l'issue du module (débuté au S4 et terminé au S6), les étudiants :

- auront une connaissance pratique d'une sélection d'outils informatiques à composante linguistique (correcteurs orthographiques et grammaticaux, outils d'aide à la traduction ou à la recherche d'informations, outils de synthèse vocale, etc.) ;
- auront une représentation des objectifs que se fixent leurs développeurs ;
- sauront concevoir des manipulations de données langagières pour en analyser automatiquement la construction ou le sens ;
- seront capables de structurer des documents textuels à éditer en ligne ou destinés à un processus éditorial multisupport (édition en ligne, imprimée et sur liseuse ou téléphone portable).

 

Le module transversal TAL combine les UE4 et UE6 des semestres 4, 5 et 6 pour un total de 9 crédits européens (6 + 3) par semestre.

Il contribue à la découvertes de techniques valorisées dans des métiers où une double compétence en linguistique, lettres ou langues et en informatique est fondamentale et peut soit préparer à la poursuite d'études en L3, en conservant un module TAL dans son programme, puis en master, en particulier dans la spécialité LTTAC ("Lexicographie, Terminographie et Traitement Automatique des Corpus") de la mention SDL ("Sciences du langage") du master "Sciences Humaines et Sociales" proposé à l'Université Lille 3, soit constituer un complément de formation utile pour les étudiants se destinant aux métiers des industries de la langue, de la traduction, de l'édition voire de l'enseignement (où les savoir-faire acquis pourront être exploités dans le cadre des préparations de cours ou pour des exercices à réaliser avec les élèves).

Contenus de formation

Pour réaliser ses objectifs, le module transversal TAL articule 3 composantes, distribuées en 2 UE (unités d’enseignement) réparties sur 3 semestres.

Une bibliographie sera proposée durant les premiers cours de chaque UE, mais celle proposée sur le site du M1 LTTAC peut documenter les étudiants impatient d'en apprendre plus.

L2 S4

S4 UE4 : l'UE4 est composée de deux éléments constitutifs d'une durée semestrielle de 24 heures.
- Le premier consiste en une initiation à la segmentation automatique des énoncés en langues naturelles (les langues que nous parlons), une des tâches élémentaires pour leur manipulation informatique.

- Le second permet de s'initier à la structuration informatique de textes en HTML (le codage employé pour les sites Web).

S4 UE6 : l'UE6, d'une durée totale de 18 heures, propose de se familiariser avec des outils de correction orthographique et grammaticale, de découvrir les produits existants et leur mode de fonctionnement.

L3 S5

S5 UE4 : l'UE4 est composée de deux éléments constitutifs d'une durée semestrielle de 24 heures.

- Le premier consiste en une initiation à l'analyse syntaxique automatique, une des tâches élémentaires pour la manipulation informatique d'énoncés en langues naturelles (les langues que nous parlons).

- Le second permet de s'initier à des conversions de format de codage informatique des textes en transformant des textes rédigés dans un traitement de textes (comme OpenOffice writer ou Microsoft Word) en documents structurés en XML exploitables dans un processus éditorial.

S5 UE6 : l'UE6, d'une durée totale de 18 heures, propose de découvrir des outils de synthèse vocale, de faire connaissance avec des produits existants et leur mode de fonctionnement (en particulier quand ils sont intégrés aux outils d'aide pour les personnes mal ou non-voyantes, et plus largement dans les outils d'aide à la communication).

L3 S6

S6 UE4 : l'UE4 est composée de deux éléments constitutifs d'une durée semestrielle de 24 heures.

- Le premier consiste en une initiation à l'analyse sémantique d'énoncés en langues naturelles, avec toutes les difficultés de description, de modélisation et de mise en œuvre que cela suppose.

- Le second permet de s'initier à la constitution de corpus documentaires ou de textes annotés en XML et exploitables dans le cadre de recherches linguistiques ou d'éditions parallèles de textes (par exemple de textes traduits).

S6 UE6 : l'UE6, d'une durée totale de 18 heures, propose de découvrir des outils de traduction assistée par ordinateur, de découvrir les produits existants et leur mode de fonctionnement.

Haut

Modalités de candidature

Les étudiants désireux de suivre le module transversal TAL feront parvenir

(i) par courrier électronique envoyé à Nathalie Gasiglia (nathalie.gasiglia@univ-lille3.fr) : un message précisant ce qui motive l'intention de suivre les UE4 et UE6 TAL et indiquant le parcours de formation universitaire suivi (antérieur et en cours) ;

(ii) sous enveloppe adressée à Nathalie Gasiglia et déposée au secrétariat de Lettres modernes : une photographie avec nom et prénom indiqués au verso.

L'inscription auprès de N. Gasiglia est un préalable obligatoire à l'inscription administrative. Une réponse sera fournie dans les quelques jours par courrier électronique.

En L2 (S4), cette double démarche doit être réalisée au plus tard le premier vendredi de décembre.

En L3 (S5 + S6), elle doit l'être dès que possible et au plus tard lors de la première séance (l'horaire et le lieu de celle-ci seront précisés dans le message reçu par chaque étudiant en réponse à sa demande d'inscription et à l'UFR de Lettre Modernes).

Module transversal porté par
la Licence
"Arts, Lettres, Langues et Communication"
Mention "Sciences du Langage"