Issue |
SHS Web Conf.
Volume 46, 2018
6e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Article Number | 08002 | |
Number of page(s) | 20 | |
Section | Morphologie | |
DOI | https://doi.org/10.1051/shsconf/20184608002 | |
Published online | 09 July 2018 |
Détection automatique, description linguistique et suivi des néologismes en corpus : point d'étape sur les tendances du français contemporain
1
UniversitéParis 13, LIPN-RCLN UMR 7030 CNRS, Labex EFL, 99 avenue Jean-Baptiste Clément, Villetaneuse 93430, France
2
UniversitéParis 13, HTL UMR 7597 CNRS, 5 rue Thomas Mann, Paris cedex 13 Case postale 7034, 75205, France
3
UniversitéParis 7, CLILLAC-ARP EA 3967, 5 rue Thomas Mann, Paris cedex 13 Case postale 7002, 75205, France
4
Collège de France et LT2D, Lexiques, textes, discours, dictionnaires, universitéde Cergy-Pontoise, France
5
Università degli Studi di Verona, Dipartimento di Lingue e Letterature Straniere, Italie
emmanuel.cartier@lipn.univ-paris13.fr
L'objet du présent article est de faire un point d'étape sur unprojet de recherche, Néoveille, commencé en 2015 et visantà confectionner une plateforme pour détecter automatiquement, décrire linguistiquement et suivre le cycle de vie des néologismes en corpus dynamique contemporain, en sept langues. Nous nous concentrons ici sur les résultats obtenus sur le français. Nous introduisons tout d'abord quelques jalons théoriques permettant de situer le phénomène néologique. Ensuite, nous présentons la plateforme web qui a été construiteet qui offre aux linguistes un outil pour la détection automatique, l'analyse linguistique et de le suivi des néologismes sur corpus dynamique. Enfn, une dernière partie fait un point sur les tendances néologiques du français contemporain, suite à la collecte automatique, à la validation manuelle et à la description linguistique des innovations lexicales détectées depuis 2015 dans près de 250 sources de presse.
Abstract
Automatic Detection, Linguistic Description and Life-cycle of Neologisms in Corpus : French Contemporary Tendencies from the Neoveille Platform. This article describes a research project, Néoveille, that began in 2015, whose goal is to setup a web platform to automatically detect, linguistically analyse and follow the life-cycle of neologisms in contemporary monitor corpora, in seven languages. Here, we focus on the results obtained for the French language.We frst introduce severaltheoretical hypotheses to defne the concept of lexical innovation. We then present the web platform and its components. Finally, we detail the current results and trends for the French language, from the automatic detection, the manual validation and linguistic description of more than 20.000 neologisms in about 250 web newspapers since 2015.Les néologismes, ou innovations lexicales, ont souvent et longtemps été considérés comme un phénomène secondaire, notamment de par la rareté de leurs occurrences en discours et leur faible impact apparent sur la structure des langues. Pourtant, ces innovations fournissent de précieuses informations sur différents mécanismes linguistiques sous-jacents, de l'emprunt à l'affixation, en passant par la composition et les phénomènes de réduction. Pour faible que soit le taux de néologisme dans les textes, il n'en reste pas moins que le mécanisme néologique est la preuve de la vitalité d'une langue et de sa créativité, et constitue une propriété essentielle des langues vivantes. Les néologismes fournissent également de précieuses informations sur les tendances sociétales, qu'il s'agisse de besoins expressifs ou encore d'utilisations liées au prestige et permettent ainsi de tracer les contours de groupes sociaux spécifiques. Avec l'avènement des technologies et corpus numériques, il est maintenant possible d'étudier ce phénomène à grande échelle. L'objet du présent article est de faire un point d'étape sur un projet de recherche, Néoveille, commencé en 2015 et visant à confectionner une plateforme pour détecter automatiquement, décrire linguistiquement et suivre le cycle de vie des néologismes en corpus dynamique contemporain, en sept langues. Nous nous concentrons ici sur les résultats obtenus sur le français. Nous introduisons tout d'abord quelques jalons théoriques permettant de situer le phénomène néologique. Ensuite, nous présentons la plateforme web qui a été construiteet qui offreaux linguistes un outil pour la détecction automatique, l'analyse linguistique et de le suivi des néologismes sur corpus dynamique. Enfin, une dernière partie fait un point sur les tendances néologiques du français contemporain, suite à la collecte automatique, à la validation manuelle et à la description linguistique des innovations lexicales détectées depuis 2015 dans près de 250 sources de presse. L'ensemble des données collectées et analysées sont disponibles sur la plateforme du projet1.
© The Authors, published by EDP Sciences
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.