Issue |
SHS Web Conf.
Volume 138, 2022
8e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Article Number | 10001 | |
Number of page(s) | 17 | |
Section | Ressources et outils pour l’analyse linguistique | |
DOI | https://doi.org/10.1051/shsconf/202213810001 | |
Published online | 11 May 2022 |
Étude linguistique et statistique des unités de performance écrite : le cas de et
1 Université Sorbonne Nouvelle, CLESTHIA, 75005, Paris, France
2 Université Paris Nanterre, MoDyCo, 92001, Nanterre, France
3 Université de Lorraine, ATILF, 54063, Nancy Cedex, France
* Corresponding author: quentin.feltgen@gmail.com
Résumé
Cet article aborde la question de la segmentation par des pauses du flux de production écrite enregistré en temps réel et de la motivation linguistique et statistique de l’emplacement des pauses. En effet, les pauses segmentant des séquences textuelles linguistiquement analysables, il est crucial de comprendre si des contraintes régulières en fixent les frontières. Nous avons choisi de nous pencher sur le cas de la conjonction et, en vertu de la diversité sémantique et morphosyntaxique des relations qu’elle sémiotise. Après avoir mis en perspective les résultats d’une analyse de corpus antérieure, nous procédons à une annotation manuelle des occurrences en départageant les emplois extra- et intraphrastiques de et dans un corpus de textes courts produits par des adultes (étudiants). Une méthode d’analyse statistique est ensuite appliquée aux données annotées pour tester les attentes statistiques en termes d’emplacement des pauses. Cette analyse permet de faire ressortir des différences de segmentation en fonction du type d’emploi de et.
Resumen
Linguistic and statistical study of written performance units: the case of et in French. This paper addresses the issue of segmentation by pauses of the stream of written production recorded in real time and the linguistic and statistical relevance of the location of these pauses. Indeed, as pauses segment linguistically analyzable textual sequences, it is crucial to understand whether regular constraints set their boundaries. We have chosen to focus on the case of the conjunction and (et) due to the semantic and morphosyntactic diversity of the relations it semiotizes. Once put into perspective the results of a previous corpus analysis, we proceed to a manual annotation of the occurrences by separating the extra- and intraphrastic uses of and in a corpus of short texts produced by adults (students). A statistical analysis method is then applied to the annotated data to test statistical expectations in terms of break location. This analysis reveals differences in segmentation based on the type of use of et.
© The Authors, published by EDP Sciences, 2022
This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.