Contenus de formation
Pour réaliser ses
objectifs, le module transversal TAL articule 3 composantes, distribuées en
2 UE (unités d’enseignement) réparties sur 3 semestres.
Une
bibliographie sera proposée durant les premiers cours de chaque UE,
mais celle proposée sur le site
du M1 LTTAC peut documenter les étudiants impatient d'en
apprendre plus.
L2 S4
S4
UE4 : l'UE4 est composée de deux éléments constitutifs d'une
durée semestrielle de 24 heures.
- Le premier consiste en une initiation à la segmentation automatique
des énoncés en langues naturelles (les langues que nous parlons),
une des tâches élémentaires pour leur manipulation informatique.
-
Le second permet de s'initier à la structuration informatique de
textes en HTML (le codage employé pour les sites Web).
S4
UE6 : l'UE6, d'une durée totale de 18 heures, propose de se
familiariser avec des outils de correction orthographique et
grammaticale, de découvrir les produits existants et leur mode de
fonctionnement.
L3 S5
S5
UE4 : l'UE4 est composée de deux éléments constitutifs d'une
durée semestrielle de 24 heures.
-
Le premier consiste en une initiation à l'analyse syntaxique
automatique, une des tâches élémentaires pour la manipulation
informatique d'énoncés en langues naturelles (les langues que nous
parlons).
-
Le second permet de s'initier à des conversions de format de codage
informatique des textes en transformant des textes rédigés dans un
traitement de textes (comme OpenOffice writer ou Microsoft Word) en
documents structurés en XML exploitables dans un processus éditorial.
S5
UE6 : l'UE6, d'une durée totale de 18 heures, propose de découvrir
des outils de synthèse vocale, de faire connaissance avec des
produits existants et leur mode de fonctionnement (en particulier
quand ils sont intégrés aux outils d'aide pour les personnes mal ou
non-voyantes, et plus largement dans les outils d'aide à la
communication).
L3 S6
S6
UE4 : l'UE4 est composée de deux éléments constitutifs d'une
durée semestrielle de 24 heures.
-
Le premier consiste en une initiation à l'analyse sémantique d'énoncés
en langues naturelles, avec toutes les difficultés de description, de
modélisation et de mise en œuvre que cela suppose.
-
Le second permet de s'initier à la constitution de corpus
documentaires ou de textes annotés en XML et exploitables dans le
cadre de recherches linguistiques ou d'éditions parallèles de textes
(par exemple de textes traduits).
S6
UE6 : l'UE6, d'une durée totale de 18 heures, propose de découvrir
des outils de traduction assistée par ordinateur, de découvrir les
produits existants et leur mode de fonctionnement.
