Issue |
SHS Web Conf.
Volume 186, 2024
Colloque E-CALM : Analyser de grands corpus scolaires et universitaires : des questions pour la recherche et pour la formation (E-CALM 2022)
|
|
---|---|---|
Article Number | 01002 | |
Number of page(s) | 21 | |
Section | E-CALM : Présentation | |
DOI | https://doi.org/10.1051/shsconf/202418601002 | |
Published online | 18 March 2024 |
Rendre « vilisible » l’écriture scolaire. Choix de transcription et d’annotation pour une mise en corpus
Making school writing visible and legible. Transcribing and annotating a corpus of text
Université de Bordeaux, Lab-E3D
Université Grenoble Alpes, Lidilem
Cet article expose les bases théoriques et méthodologiques du corpus E-CALM. Ce corpus a été construit pour répondre à la nécessité de documenter les compétences scripturales des élèves en France à différents niveaux de la scolarité. E-CALM constitue un réservoir de données textuelles exploitables par la recherche et par la formation des enseignants. Les choix de traitement des manuscrits recueillis ont permis de faire émerger les traces de l’écriture des élèves et de leurs interactions avec les enseignants corrigeant et commentant les copies. Explorer avec des outils informatiques un grand corpus d’écrits scolaires permet de confirmer des connaissances déjà acquises mais aussi de faire apparaitre des éléments nouveaux, invisibles à l’observation de données de faibles tailles et qu’un grand corpus tel qu’E-CALM (plus d’un million de mots) permet de révéler. Une fois produite, l’analyse linguistique conduit à des avancées didactiques : en faisant émerger des éléments discriminants des textes, corrélés à des variables didactiques et sociologiques, elle permet de proposer des protocoles d’enseignement ajustés aux contextes d’apprentissage.
Abstract
This article presents the theoretical and methodological foundations of the E-CALM corpus. This corpus was built in response to the need to document the writing skills of students in France at different levels of schooling. E-CALM is a reservoir of textual data that can be used for research and teacher training. The choices made in the processing of the manuscripts collected have made it possible to bring out the traces of pupils’ writing and their interactions with the teachers who corrected and commented on the copies. The study of a large corpus of school writing with the help of IT tools allows us to confirm what we already know, but also to bring to light new elements that are invisible when observing small amounts of data, but which can be revealed by a large corpus such as E-CALM (over one million words). Once produced, the linguistic analysis leads to didactic advances: by bringing out discriminative elements in the texts, correlated with didactic and sociological variables, it makes it possible to propose teaching protocols tailored to the learning context.
Mots clés : écrits non standard / annotation des opérations d’écriture / corpus scolaire et universitaire / développement des compétences scripturales
Key words: non-standard writing / annotating writing operations / school and academic corpus / developing writing skills
© The Authors, published by EDP Sciences, 2024
This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.