beandeau>

Programme > Conférences

Mercredi 5 novembre 2025 | Salle de conférences du bâtiment Inist

Corpus en linguistique : de la constitution à l'exploitation (14h00 - 15h15)

Christophe Benzitoun
Maître de conférences, Atilf (UMR 7118, Université de Lorraine-CNRS)

Résumé : La linguistique est la discipline scientifique qui s'intéresse au fonctionnement des langues et du langage. Pour ce faire, on utilise de plus en plus souvent des corpus oraux et écrits. Cela permet d'appréhender la richesse des usages des locuteurs. Dans ma présentation, je décrirai la chaîne de traitement allant de la constitution du corpus jusqu'à son exploitation informatisée. Ma visée sera principalement méthodologique, sans toutefois perdre de vue les aspects théoriques et les précautions à prendre quand on constitue ou exploite des corpus. Les corpus représentent un changement de paradigmes dans de nombreuses disciplines et il est important d'en appréhender les transformations que cela induit, mais aussi les précautions à prendre pour en connaître les bonnes pratiques.

Explorer le multilinguisme dans les références scientifiques avec Istex : méthodes et perspectives pour la fouille textuelle (15h30 - 16h45)

Iana Atanassova
Professeure des Universités, CRIT (UR 3224, Université Marie & Louis Pasteur), Institut Universitaire de France (IUF)

La plateforme Istex est l’une des rares ressources pour l’exploration de la diversité linguistique dans la littérature scientifique, grâce à son corpus multilingue en plein texte. L’analyse des références bibliographiques issues du corpus Istex nous a permis de mettre en évidence la prédominance de l’anglais comme lingua franca, mais aussi la mobilisation de connaissances issues d’articles dans plus de cinquante autres langues. Grâce à la détection automatique de la langue des références, il devient possible d’analyser finement les pratiques de citation et les flux d’information entre langues et disciplines, offrant ainsi des perspectives concrètes en linguistique de corpus, bibliométrie et traitement automatique des langues. Cette présentation vise à montrer, à partir de cas pratiques, comment exploiter Istex pour mener des analyses de corpus scientifiques et en particulier étudier le multilinguisme des références scientifiques, avec des résultats directement mobilisables pour la formation et la recherche.

Marc Bertin
Maître de conférences, ELLIADD (UR 4661, Université Marie & Louis Pasteur)

(Résumé à venir)

Chargement... Chargement...