Issue |
SHS Web of Conferences
Volume 8, 2014
4e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Page(s) | 2691 - 2706 | |
Section | Ressources et Outils pour l'analyse linguistique | |
DOI | https://doi.org/10.1051/shsconf/20140801359 | |
Published online | 24 July 2014 |
Le corpus ANCOR_Centre et son outil de requêtage : application à l’étude de l’accord en genre et nombre dans les coréférences et anaphores en français parlé
1
Université François Rabelais de Tours, 3 place Jean Jaurès, 41000 Blois, France
2
Laboratoire Ligérien de Linguistique, UMR 7270, 10 Rue de Tours, BP. 46527, 45065 Orléans, France
Contact : Jean-Yves.Antoine@univ-tours.fr
Cet article présente les premières études de corpus réalisés sur ANCOR_Centre, un nouveau corpus de français parlé annoté en relations de coréférence ou anaphoriques. Par sa taille (488 000 mots, 100 000 mentions, 50000 relations), ce corpus est sans équivalent sur le français et soutient la comparaison avec les plus grands corpus de coréférence existant sur d’autres langues. Dans un premier temps, nous détaillons la réalisation de cette ressource qui est diffusée librement sous licence Creative Commons. Puis nous présentons l’outil de requêtage associé au corpus, qui offre à la communauté des sciences du langage des capacités d’analyse exhaustives et précises du corpus, autant pour des études quantitatives que qualitatives (concordancier). Cet outil a été utilisé pour décrire quantitativement le contenu du corpus ANCOR, ce qui fait l’objet de la troisième partie de l’article. Enfin, nous présentons une étude originale basée là encore sur l’analyse par requête du corpus, qui montre qu’en français parlé, l’hypothèse d’accord systématique en genre et nombre entre la coréférence et son antécédent est loin d’être assurée
© aux auteurs, publié par EDP Sciences, 2014
Article en accès libre placé sous licence Creative Commons Attribution 4.0
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.