Étude linguistique et statistique des unités de performance écrite : le cas de et

Quentin Feltgen; Georgeta Cislaru; Christophe Benzitoun

doi:10.1051/shsconf/202213810001

All issues

Volume 138 (2022)

SHS Web Conf., 138 (2022) 10001

Abstract

Open Access

Issue		SHS Web Conf. Volume 138, 2022 8^e Congrès Mondial de Linguistique Française


Article Number		10001
Number of page(s)		17
Section		Ressources et outils pour l’analyse linguistique
DOI		https://doi.org/10.1051/shsconf/202213810001
Published online		11 May 2022

SHS Web of Conferences 138, 10001 (2022)

Étude linguistique et statistique des unités de performance écrite : le cas de et

Quentin Feltgen¹^*, Georgeta Cislaru² and Christophe Benzitoun³

¹ Université Sorbonne Nouvelle, CLESTHIA, 75005, Paris, France
² Université Paris Nanterre, MoDyCo, 92001, Nanterre, France
³ Université de Lorraine, ATILF, 54063, Nancy Cedex, France

^* Corresponding author: This email address is being protected from spambots. You need JavaScript enabled to view it.

Résumé

Cet article aborde la question de la segmentation par des pauses du flux de production écrite enregistré en temps réel et de la motivation linguistique et statistique de l’emplacement des pauses. En effet, les pauses segmentant des séquences textuelles linguistiquement analysables, il est crucial de comprendre si des contraintes régulières en fixent les frontières. Nous avons choisi de nous pencher sur le cas de la conjonction et, en vertu de la diversité sémantique et morphosyntaxique des relations qu’elle sémiotise. Après avoir mis en perspective les résultats d’une analyse de corpus antérieure, nous procédons à une annotation manuelle des occurrences en départageant les emplois extra- et intraphrastiques de et dans un corpus de textes courts produits par des adultes (étudiants). Une méthode d’analyse statistique est ensuite appliquée aux données annotées pour tester les attentes statistiques en termes d’emplacement des pauses. Cette analyse permet de faire ressortir des différences de segmentation en fonction du type d’emploi de et.

Resumen

Linguistic and statistical study of written performance units: the case of et in French. This paper addresses the issue of segmentation by pauses of the stream of written production recorded in real time and the linguistic and statistical relevance of the location of these pauses. Indeed, as pauses segment linguistically analyzable textual sequences, it is crucial to understand whether regular constraints set their boundaries. We have chosen to focus on the case of the conjunction and (et) due to the semantic and morphosyntactic diversity of the relations it semiotizes. Once put into perspective the results of a previous corpus analysis, we proceed to a manual annotation of the occurrences by separating the extra- and intraphrastic uses of and in a corpus of short texts produced by adults (students). A statistical analysis method is then applied to the annotated data to test statistical expectations in terms of break location. This analysis reveals differences in segmentation based on the type of use of et.

This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.

Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.

Initial download of the metrics may take a while.