Aller au contenu
image/svg+xml
ancien site de l'UFR de Linguistique (jusqu'à 2020-2021)
Outils pour utilisateurs
Connexion
Outils du site
Outils
Afficher le texte source
Liens vers cette page
Derniers changements
Gestionnaire de médias
Index
Connexion
Derniers changements
Gestionnaire de médias
Index
Vous êtes ici:
L'UFR Linguistique à l'université de Paris - campus Grands Moulins
»
Anciens cours
»
49GE06LF - Linguistique de corpus
Panneau latéral
Nouveau site (rentrée 2021)
Accueil
Informations pratiques
Enseignement
Recherche
Linglunch
LLF Working groups
Séminaire MorDev
Liens utiles
cours:49ge06lf
Table des matières
49GE06LF - Linguistique de corpus
Contenu
Informations historiques
49GE06LF - Linguistique de corpus
Contenu
rappels: notion de modélisation en linguistique
les données en linguistique: données attestées / données forgées, avantages et inconvénients
les sources de variation des données
contenu et constitution de corpus (minimalement)
méta-données : méta-données extra-linguistiques et annotations linguistiques
formats de corpus: formats ad-hoc , format XML
TPs sur machine:
concordancier antconc, recherches d'expressions régulières
interrogation de la base FRANTEXT, intégral / catégorisé
interrogation d'un corpus arboré (outil TREGEX)
Compétences théoriques visées:
avantages et inconvénients de l'utilisation de données attestées versus données forgées
les caractéristiques importantes d'un corpus
les différents types de méta-données et d'annotations linguistiques de corpus
Compétences techniques visées:
utilisation de concordanciers, recherche par expressions régulières, interrogation de FRANTEXT, recherche en corpus arboré
Informations historiques
cours/49ge06lf.txt
· Dernière modification: 2018/09/03 07:33 par
mcandito
Outils de la page
Afficher le texte source
Liens vers cette page
Haut de page