Article published In: Les variations diatopiques dans les expressions figées
Sous la direction de Pedro Mogorrón Huerta, Aude Grezka et Lucía Navarro-Brotons
[Lingvisticæ Investigationes 43:2] 2020
► pp. 280–299
Variabilité et traitement automatique des langues
Article language: French
Published online: 23 February 2021
https://doi.org/10.1075/li.00050.gre
https://doi.org/10.1075/li.00050.gre
Résumé
Par cette contribution, nous souhaitons proposer une analyse de la variation, principalement diatopique, appliquée aux
séquences figées, grâce à une ressource que nous avons développée pour le Traitement Automatique des Langues (TAL). Le grand nombre de
variantes qui apparaissent dans les corpus nous a conduit à effectuer une analyse exhaustive de ces constructions afin de permettre aux
utilisateurs et aux applications TAL, d’utiliser correctement ces séquences figées. Les données textuelles auxquelles
les méthodes et outils du TAL doivent faire face sont variées, volumineuses et de qualités plus ou moins inégales. Enfin, pour accéder au sens des textes, le TAL est confronté aux difficultés que sont les caractéristiques intrinsèques des langues naturelles.
Mots-clés: variation, figement, TAL, base de données, corpus
Abstract
Variability and automatic language processing
Through this contribution we would like to propose an analysis of the variation, mainly diatopic, applied to fixed
sequences, through a resource we have developed for Automatic Language Processing. The large number of variants that appear in corpora has
led us to carry out an exhaustive analysis of these constructions in order to allow native and non-native users, and NLP applications, to
use these fixed sequences correctly. The textual data are varied, from qualite potentially degraded and voluminous. Finally, the other
difficulty that NLP must face to access the meaning of texts are the intrinsic characteristics of natural languages.
Keywords: variability, freeze, NLP, database, corpus
Article outline
- Introduction
- 1.Les difficultés du TAL
- 1.1Le non-dit
- 1.2La polysémie
- 1.3Le figement
- 2.Le traitement du figement : constat
- 2.1Difficultés
- 2.2La variabilité linguistique
- 3.Projet
- 3.1Constitution du corpus
- 3.2La ressource
- Conclusion
- Remarques
Œuvres citées Dictionnaires
References (31)
Buscaldi, D., Grezka, A. & Lejeune, G. 2017.
Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 2017. Actes du 13e Défi Fouille de Texte (DEFT 2017), TALN 2017 (Orléans, France), 65–76.
Cartier, E. 2010. Repérage automatique des expressions figées : état des lieux, perspectives. In P. Mogorron & S. Mejri (éds), Opacité, idomaticité, traduction (Rencontre Méditerranéennes 3), 79–98. Universidad de Alicante.
Colson, J.-P. 2010. La traduction spécialisée basée sur les corpus : une expérience dans le domaine informatique. Synergies Tunisie, 21, 115–123.
Constant, M. 2012. Mettre les expressions multi-mots au cœur de l’analyse automatique de textes : sur l’exploitation de ressources symboliques externes. Traitement du texte et du document. Thèse d’HDR. Université Paris-Est. [URL]
Gayral, F. 2001. Traitement automatique et polysémie des verbes. Syntaxe et sémantique, 2 (1), 241–257.
Grezka, A. 2006. Les prédicats de perception. Traitement de la polysémie (Les sens des sens). Thèse de doctorat en Sciences du Langage, Université Paris XIII, Villetaneuse.
Grezka, A. & Viguier, M.-H. (eds.) 2017. Figement en mouvement et complexité en devenir : regards sur quelques problèmes liés aux structures défigées et complexes. Études de linguistique appliquée, 1861.
Grezka, A., Niziołek, M. & Buscaldi, D. 2019. Description de quelques procédés linguistiques de l’ironie, par le biais des tweets sur les transports en commun en français et en polonais. Studia Romanica Posnaniensia, 46 (1), 43–64.
Gross, G. 1996. Les expressions figées en français : noms composés et autres locutions. Paris: Ophrys.
2012. Manuel d’analyse linguistique – Approche sémantico-syntaxique du lexique. Villeneuve-d’Ascq: Presses universitaires du Septentrion.
Klein, J. & Lamiroy, B. 2016. Pour une analyse diatopique des expressions verbales figées : une approche variationniste. In: S. Mejri & G. Gross (éds), Phraséologie et profils combinatoires. Lexique, syntaxe et sémantique, 91–102. Paris: Champion.
Labov, W. 1966. The social stratification of English in New York City. Washington DC: Centre for Applied Linguistics.
1976.
Sociolinguistique (Traduction française de Labov (1972) Sociolinguistic patterns. Philadelphie: University of Pennsylvania Press). Paris: Minuit.
Lamiroy, B. 2008. Le figement : à la recherche d’une définition. Zeitschrift für Französische Sprache und Literatur, Beiheft 361, 85–99.
Lamiroy, B. (coord.), Klein, J. R., Labelle, J., Leclère, C., Meunier, A. & Rossari, C. 2010. Les expressions verbales figées de la francophonie : Belgique, France, Québec, Suisse. Paris: Ophrys.
Mathieu-Colas, M. 2009.
Morfetik, une ressource lexicale pour le TAL. Cahiers de Lexicologie, 941, 137–146.
Boulanger, J.-C., Dugas, J.-Y. et B. de Bessé (dir.). 1992. Dictionnaire québécois d’aujourd’hui : langue française, histoire, géographie/culture, Montréal, DicoRobert inc.
Cited by (2)
Cited by two other publications
Ganfi, Vittorio, Valentina Piunno & Lunella Mereu
This list is based on CrossRef data as of 25 november 2025. Please note that it may not be complete. Sources presented here have been supplied by the respective publishers. Any errors therein should be reported to them.
