Issue |
SHS Web of Conferences
Volume 8, 2014
4e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Page(s) | 2663 - 2674 | |
Section | Ressources et Outils pour l'analyse linguistique | |
DOI | https://doi.org/10.1051/shsconf/20140801362 | |
Published online | 24 July 2014 |
Extraction de pivots complexes pour l'exploration de la combinatoire du lexique : une étude dans le champ des noms d'affect
1
LIDILEM, Université Grenoble Alpes, BP. 25, 38040 Grenoble Cedex 9, France
2
Romanisches Seminar, Université de Cologne, 2. Stock, Philosophikum, Albertus-Magnus-Platz, 50923 Köln, Allemagne
Contact : olivier.kraif@u-grenoble3.fr
Dans cet article, nous présentons une approche visant à caractériser et catégoriser les collocatifs verbaux d'une certaine classe de noms (ici des noms d'affect) pris au travers d'une relation syntaxique préalablement fixée (ici la relation verbe - complément d'objet). Nous faisons l'hypothèse que les propriétés sémantiques des unités sont reflétées par leur propriétés combinatoires, et notamment par l'étude des constructions préfabriquées typiques de ces unités, qui traduisent ce que Sinclair (1991) appelle le « principe de l'idiome » (par opposition au « principe du libre choix »). Pour étudier le profil combinatoire (au sens de Blumenthal, 2006) des unités, nous exploitons un outil interrogeable en ligne, EmoConc (Kraif, Diwersy, 2012), permettant, pour un pivot donné, d'extraire l'ensemble de ses cooccurrents avec les valeurs de son tableau de contingence, ce que Tournier et Heiden (1998) nomment son lexicogramme. Mais à la différence de ces derniers, nous ne retenons ici que les cooccurrences syntaxiques (par exemple un verbe et son objet direct), et non les cooccurrences de surface : les cooccurrences syntaxiques présentent en effet l'intérêt de réduire à la fois le bruit et le silence (Evert, 2008 ; Seretan 2010), les cooccurrents pertinents pouvant se situer à une distance arbitraire dans la phrase, au delà d'une fenêtre dont la largeur est fixée à priori.
La première partie de cette communication est consacrée à la présentation d'EmoConc et de ses fonctionnalités. Dans un second temps, nous présentons une étude de cas, autour des verbes liés à la verbalisation des émotions (hurler sa joie, confier sa honte, …), destinée à explorer les potentialités de l'extraction des lexicogrammes. Nous montrons ainsi que la prise en compte de « pivots complexes », permettant de définir un ensemble de contraintes lexicales et syntaxiques autour du pivot (et donc des collocatifs) permet de mieux circonscrire, sur un plan sémantique, le champ des pivots étudiés. Nous examinons enfin une série de constructions plus générales issues de notre méthode d'extraction d'expressions polylexicales, basée sur l'expansion itérative des pivots complexes, et observons dans quelle mesure ces configurations permettent de mieux circonscrire les propriétés sémantiques des unités lexicales. Nous concluons sur des prolongements possibles de notre méthodologie.
© aux auteurs, publié par EDP Sciences, 2014
Article en accès libre placé sous licence Creative Commons Attribution 4.0
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.