Issue |
SHS Web Conf.
Volume 138, 2022
8e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Article Number | 10002 | |
Number of page(s) | 17 | |
Section | Ressources et outils pour l’analyse linguistique | |
DOI | https://doi.org/10.1051/shsconf/202213810002 | |
Published online | 11 May 2022 |
Extraction de Phrases Préfabriquées des Interactions à partir d’un corpus arboré du français parlé : une étude exploratoire
1 Univ. Grenoble Alpes, LIDILEM, Bâtiment Stendhal CS40700 38058 Grenoble cedex 9, France
2 Univ. Grenoble Alpes, CNRS, Grenoble INP, LIG, CS 40700 38058 Grenoble Cedex 9, France
* Corresponding author: pauselinguist@gmail.com
Résumé
Dans cette étude exploratoire, nous nous intéressons aux Phrases Préfabriquées des Interactions (p. ex. c’est clair ; je te jure ; on dirait). Après avoir défini ce type de phrase, nous évaluons dans quelle mesure le corpus arboré Orféopeut être exploité pour extraire et caractériser ces éléments. Les résultats de l’analyse qualitative montrent que le repérage des phrases parenthétiques apparaît plus complexe que pour les clausatifs (propositions indépendantes). Nous montrons aussi comment l’outil Lexicoscope permet, en exploitant la combinatoire lexico-syntaxique et la distribution des éléments entre et à l’intérieur des tours de parole, de mieux cerner les caractéristiques de ces phrases préfabriquées.
Resumen
Extraction of Prefabricated Interaction Phrases from a French Spoken Treebank : An Exploratory Study. In this exploratory study, we are interested in Prefabricated Phrases of Interactions (e.g., ‘c’est clair’; ‘je te jure’; ‘on dirait’). After defining this type of sentence, we evaluate to what extent the Orféo treebank can be exploited to extract and characterize these elements. The results of the qualitative analysis show that the identification of parenthetical sentences appears to be more complex and difficult than for clausatives. We also show how the Lexicoscope tool allows us, by exploiting the lexical-syntactic combinatorics and the distribution of the elements between and within the speech turns, to better identify the characteristics of these prefabricated sentences.
© The Authors, published by EDP Sciences, 2022
This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.