Issue |
SHS Web of Conferences
Volume 27, 2016
5e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Article Number | 11001 | |
Number of page(s) | 15 | |
Section | Ressources et Outils pour l’analyse linguistique | |
DOI | https://doi.org/10.1051/shsconf/20162711001 | |
Published online | 04 July 2016 |
Les écrits d’élèves : un corpus de référence pour le français contemporain
1 Université de Cergy-Pontoise, Laboratoires AGORA – EA 7392 & CLESTHIA – EA 7345
2 Université La Sorbonne nouvelle – Paris 3, Laboratoire CLESTHIA – EA 7345
jacques.david@u-cergy.fr
doquet.claire@orange.fr
La situation d’apprentissage de l’écriture et les difficultés qu’elle révèle mettent au jour des zones de la langue qui apparaissent caractéristiques et délicates à maîtriser chez les scripteurs débutants. Ce constat nous a conduits à constituer une base de données d’écrits d’élèves en vue d’explorer systématiquement les différentes composantes du français qui résistent ou qui évoluent dans le processus d’acquisition de l’écriture. Notre communication retrace, dans un premier temps, les problèmes spécifiques posés par ce type de corpus, en particulier pour ce qui concerne le protocole de transcription et d’annotation. Les écarts à la norme des apprentis scripteurs doivent en effet faire l’objet d’annotations spécifiques pour que les éléments verbaux soient lemmatisés correctement. Dans une deuxième partie, nous exposons deux types d’investigations menées dans ce corpus à propos de la ponctuation blanche : i) les espaces et blancs de textes ; ii ) la segmentation de mots. Il s’agit de montrer comment le corpus que nous constituons, à travers les conventions d’annotation qui ont été construites, permet de repérer des éléments caractéristiques de la manière dont les élèves délimitent et ponctuent leurs écrits, mais aussi d’observer comment cette ponctuation blanche évolue pour en extraire des indications propres à accompagner ou renouveler les apprentissages induits.
Abstract
The learning of writing and the difficulties it reveals bring to light parts of the language that are both characteristic of beginner writers and delicate for them to master. This observation led us to compile a database of student writing in order to systematically explore the different components of French that withstand change or evolve in the process of acquiring writing skills. Our article will thus firstly track the problems specific to this type of corpus, in particular what concerns the protocols of transcription and annotation. The beginner writers’ alterations from the norm have to be annotated in a particular manner so that verbal elements are properly lemmatized. In a second part, we will expose two types of investigations conducted in this corpus concerning white punctuation: i) spaces and whites in texts; ii) the segmentation of words. The purpose is to show how the corpus we are compiling, and through the conventions of annotations we have devised, enables us to pinpoint characteristic elements of the way in which students demarcate and punctuate their writings, and also to observe how white punctuation develops. This will enable the extraction of indications that can accompany or renew induced learning.
© Owned by the authors, published by EDP Sciences, 2016
This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.