Article published In: Revista Española de Lingüística Aplicada/Spanish Journal of Applied Linguistics
Vol. 35:1 (2022) ► pp.294–331
Extracción de fraseología especializada basada en corpus
Evaluación de sistemas
Article language: Spanish
Published online: 8 February 2022
https://doi.org/10.1075/resla.18058.gal
https://doi.org/10.1075/resla.18058.gal
Abstracta
En este trabajo se describe la evaluación de extracción de unidades fraseológicas especializadas a partir de un corpus español. Tras repasar brevemente diversos estudios en torno a los conceptos de unidad terminológica y unidad fraseológica especializada, así como su identificación y extracción, se presenta un protocolo de evaluación centrado en aspectos de usabilidad y precisión que se aplica a tres sistemas de explotación de corpus. Los resultados confirman parcialmente la hipótesis de que los extractores terminológicos permiten extraer unidades fraseológicas especializadas. Por último, se hacen algunas sugerencias con el ánimo de optimizar el funcionamiento de estos sistemas.
Abstract
Corpus-based specialised phraseology extraction: Systems evaluation
This paper describes the evaluation of specialized phraseological units extraction from a corpus in Spanish. After briefly reviewing the literature on the concepts of terminological unit and specialized phraseological unit, their detection and their extraction, an evaluation protocol is presented and applied to three corpus software interfaces. The evaluation focuses on precision and usability aspects. The results partially confirm the hypothesis that term extractors allow users to extract specialized phraseological units. Finally, a series of suggestions are made to improve such systems.
Keywords: specialized phraseology, term extractors, evaluation, corpora
Article outline
- 1.Introducción
- 2.Revisión teórica
- 2.1Concepto de unidad terminológica
- 2.2Concepto de unidad fraseológica especializada
- 2.2.1Enfoque colocacional
- 2.2.2Enfoque formulaico
- 2.2.3Enfoque sintagmático
- 2.3Evaluación de extractores
- 2.3.1Extracción de terminología monolingüe
- 2.3.2Extracción de terminología bilingüe
- 2.3.3Extracción de fraseología
- 2.4Recapitulación
- 3.Estudio de caso
- 3.1Unidad de trabajo
- 3.2Descripción del corpus de trabajo
- 3.3Sistemas escogidos
- 3.4Protocolo de evaluación
- 3.4.1Extracción masiva
- 3.4.2Estudio individualizado
- 3.4.3Evaluación de la precisión
- 3.4.4Recapitulación
- 3.5Discusión y propuestas
- 4.Conclusión
- Nota
Referencias
References (40)
Aguado, G. (2007). La fraseología en las lenguas especializadas. In E. Alcaraz, J. Mateo & F. Yus (Eds.), Las lenguas profesionales y académicas, (pp. 53–65). Madrid: Ariel.
Benavent, P., & Parrilla, S. (2007). Análisis de la extracción automática de términos con el programa informático Extraterm, Fòrum de Recerca: XII Jornadas de Fomento de la investigación en Traducción, UJI.
Bertrand, C. (1999). Étude comparative des combinaisons lexicales spécialisées dans deux domaines de spécialité: collocations lexicales et collocations conceptuelles en aéronautique et en philosophie. Montréal: Université.
Bevilacqua, C. (2004). Unidades fraseológicas especializadas eventivas: descripción y reglas de formación en el ámbito de la energía solar. Tesis doctoral. UPF.
Bowker, L., & Hawkins, S. (2006). Variation in the organization of medical terms: Exploring some motivations for term choice. Terminology, 12(1), 79–110.
Cabré, M. (1995). On diversity and terminology. Terminology, 2(1), 1–16.
(2008). El principio de poliedricidad: la articulación de lo discursivo, lo cognitivo y lo lingüístico en Terminología (I). Ibérica, 161, 9–36.
Cowie, A. (1994). Phraseology. In E. Asher & J. Simpson (Eds.), The encyclopedia of Language and Linguistics (pp. 3168–3171). Oxford: OUP.
Claveau, V., & L’Homme, M. (2004). Discovering Specific Semantic Relationships between Nouns and Verbs in a Specialized French Corpus. In CompuTerm 2004 – 3rd International Workshop on Computational Terminology (pp. 39–46).
Drouin, P. (2003). Term Extraction using non-technical corpora as a point of leverage. Terminology, 9(1), 99–115.
El Hadi, M., Ismail, W., Dabbadie, T., Choukri, K., Hamon, O., & Chiao, Y. (2006). Terminological Resources Acquisition Tools: Toward a User-oriented Evaluation Model. In LREC 2006 Proceedings, 945–948. Available at [URL]
Estopà, R. (1999). Eficiencia en la extracción automática de terminología. Perspectives: Studies in Traductology, 7(2), 277–286.
(2009). Los extractores de terminología: logros y escollos. In A. Alcina, E. Valero & E. Rambla (Eds.), Terminología y Sociedad del conocimiento (pp. 117–149). Bern: Peter Lang.
Faber, P. (2009). The cognitive shift in terminology and specialized translation. MonTI 11: 107–134.
Freixa, J. (2002). La variació terminològica: anàlisi de la variació denominativa en textos de diferent grau d’especialització de l’àrea de medi ambient. Tesis doctoral, UPF.
Gouadec, D. (1994). Nature et traitement des entités phraséologiques. In D. Gouadec (Ed.), Terminologie et phraséologie. Acteurs et aménageurs, (pp. 165–193). Paris: La maison du dictionnaire.
Heid, U. (1992). Décrire les collocations: deux approches lexicographiques et leur application dans un outil informatisé. Terminologie et traduction 2/31: 523–548.
Hunston, S. (2011). Corpus Approaches to Evaluation. Phraseology and Evaluative Language. New York: Routledge.
Kilgarriff, A., Rychly, P., Smrz, P., & Tugwell, D. (2004). The Sketch Engine. In G. Williams & S. Vessier (Eds.), Proceedings of the Eleventh Euralex Congress (pp. 105–116). Lorient: UBS.
L’Homme, M., & Bertrand, C. (2000). Specialized Lexical Combinations: Should they be Described as Collocations or in Terms of Selectional Restrictions? In U. Heid et al. (Eds.), Proceedings of the Ninth EURALEX International Congress, EURALEX 2000 (pp. 497–506). Stuttgart: Universität.
L’Homme, M. (1992). Les unités phraséologiques verbales et leur représentation en terminographie. Terminologie et traduction, 2(2), 493–503.
(1997). Méthode d’accès informatisé aux combinaisons lexicales en langue technique. Meta, 42(1), 15–23.
(2000). Understanding specialized lexical combinations. Terminology, 6(1), 89–110.
Langlois, L., & Plamondon, P. (1998). Le repérage automatique de collocations équivalentes à partir de bitextes. In T. Fontenelle, P. Hiligsmann, A. Michiels, A. Moulin & S. Theissen (Eds.), Actes Euralex’98 Proceedings (pp. 175–186). Université de Liège.
Lorente, M., & Bevilacqua, C. (2000). Los verbos en las aplicaciones terminográficas. In II Simposio Iberoamericano de Terminología, Riterm 2000, Lisboa.
Lorente, M. (2001). Terminología y fraseología especializada: del léxico a la sintaxis. In M. Pérez & G. Guerrero (Eds.), Panorama actual de la terminología (pp. 159–180). Málaga: Comares.
(2001). Tipología verbal y textos especializados. In M. González & M. Souto (Eds.), Cuestiones conceptuales y metodológicas de la lingüística (pp. 143–153). Santiago de Compostela: USC.
Maniez, F. (2001). Extraction d’une phraséologie bilingue en langue de spécialité: corpus parallèles et corpus comparables. Meta, 46(3), 552–563.
Mondary, T., Nazarenko, A., Zargayouna, H., & Barreaux, S. (2012). The Quæro Evaluation Initiative on Term Extraction. In N. Calzolari et al. (Eds.), LREC 2012 Proceedings (pp. 663–669). European Language Resources Association. Available at [URL]
Névéol, A., & Ozdowska, S. (2005). Extraction bilingue de termes médicaux dans un corpus parallèle anglais/français. In Actes des 5èmes Journées d’Extraction et Gestion des Connaissances. Paris.
Rubio, M., Pastor, V., & Valero, E. (2008). Análisis de la extracción y validación bilingüe de terminología con el programa informático Multiterm Extract. Fòrum de Recerca: XII Jornadas de Fomento de la investigación en Traducción, UJI.
Sierra, G., Alarcón, R., Aguilar, C., & Bach, C. (2008). Definitional verbal patterns for semantic relation extraction. Terminology, 14(1), 74–98.
Temmerman, R. (2000). Towards New Ways of Terminology Description: The Sociocognitive-Approach. Amsterdam/Philadelphia: John Benjamins.
Vargas, C. (2012). Caracterización contrastiva (inglés-español) de la combinatoria léxica especializada: estudio basado en un corpus especializado. In P. Mogorrón & S. Mejri (Eds.), Langues spécialisées, figement et traductio,n (pp. 179–200). Alicante: UA.
Vivaldi, J., & Rodríguez, H. (2007). Evaluation of terms and term extraction systems. A practical approach. Terminology, 13(2), 225–248.
Wanner, L., Bohnet, B., Giereth, M. & Vidal, V. (2005). The first steps towards the automatic compilation of specialized collocation dictionaries. Terminology, 11(1), 143–180.
