Issue |
SHS Web Conf.
Volume 138, 2022
8e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Article Number | 01007 | |
Number of page(s) | 15 | |
Section | Discours, pragmatique et interaction | |
DOI | https://doi.org/10.1051/shsconf/202213801007 | |
Published online | 11 May 2022 |
L’analyse du discours et l’intelligence artificielle pour réaliser une écriture inclusive : le projet EMIMIC
1 Département de Traduction et d’Interprétation, Université de Bologne, Italie
2 Deparment of Control and Computer Engineering, École Polytechnique de Turin, Italie
Résumé
Cet article présente le projet E-MIMIC, une application qui vise à éliminer les préjugés et la non-inclusion dans les textes administratifs rédigés dans les pays européens, à commencer par ceux qui sont rédigés dans les langues romanes. Il présente une méthodologie conçue à partir de critères discursifs inspirés de l’analyse du discours française et utilisés pour étiqueter un corpus de documents institutionnels, qui sont utilisés pour l’apprentissage profond des réseaux neuronaux. Des architectures de modélisation profonde du langage sont exploitées pour identifier automatiquement les extraits de texte non inclusifs, suggérer des formes alternatives et produire des reformulations inclusives. Une évaluation préliminaire menée sur un ensemble de données de référence pour la langue italienne montre des résultats prometteurs, qui poussent à finaliser l’application et à la réaliser également pour d’autres langues, tel le français.
Resumen
Discourse Analysis and Artificial Intelligence to empower inclusive writing: the project E-MIMIC. This paper presents the EMIMIC project, an application that aims to eliminate non-inclusive, prejudiced language forms in administrative texts written in European countries, starting with those written in Romance languages. It presents a methodology based on discourse criteria inspired by French discourse analysis and used to label a corpus of institutional documents, which are used for the deep learning of neural networks. Deep Language Modelling architectures are exploited to automatically identify non-inclusive text snippets, suggest alternative forms, and produce inclusive text rephrasing. A preliminary evaluation conducted on a benchmark dataset in Italian shows promising results and encourages us to finalise the application and to implement it also for other languages, such as French.
© The Authors, published by EDP Sciences, 2022
This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.