Issue |
SHS Web of Conferences
Volume 27, 2016
5e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Article Number | 02001 | |
Number of page(s) | 17 | |
Section | Discours, Pragmatique et Interaction | |
DOI | https://doi.org/10.1051/shsconf/20162702001 | |
Published online | 04 July 2016 |
Codage en chaîne ou en première mention de la coréférence : approcher la structure des chaînes de référence par comparaison des deux annotations
1 Université François Rabelais de Tours, LI, E.A. 6300
2 Université d’Orléans, CNRS, LLL, UMR 7270
3 Université Paris Sorbonne, Paris 4, STIH
anais.lefeuvre@paris-sorbonne.fr
jean-yves.antoine@univ-tours.fr
emmanuel.schang@univ-orleans.fr
Cet article présente une étude expérimentale portant sur les chaînes de référence en français oral spontané. Elle a été menée le corpus de dialogue oral annoté en coféférence ANCOR et a porté sur la comparaison des résultats distributionnels obtenus sur les deux types d’annotation présentes dans le corpus : d’une part, une annotation en chaîne, qui repose sur l’identification des liens entre expressions linguistiques (nominales ou pronominales) qui ont un même référent. Et d’autre part, une annotation en première mention, où les liens sont faits entre la première mention d’une entité et les expressions suivantes qui ont le même référent. Nos résultats expérimentaux nous ont permis de retrouver certaines hypothèse de la littérature, concernent avant tout les capacités de certains types de mentions (définis, démonstratifs, pronoms etc…) à ancrer (ou non) les chaînes de référence. D’autres résultats plus originaux ont également été obtenus, qui concernent la configuration globale des chaînes appréhendées en termes de configurations de transition (ou non) entre définis et indéfinis, ou entre groupes nominaux et pronoms. Enfin, notre étude a montré que les heuristiques que l’on peut tirer sur l’accord en gere ou en nombre dans les chaînes de référence ne sont pas impactées par le type d’annotation retenu.
Abstract
This paper details an experimental study conducted on ANCOR, a French corpus of spoken dialogue annotated with co-reference relations. Two annotation schemes have been conducted on the corpus: on the one hand, annotation of reference chains consisting in identifying relations between successive mentions of a referent, on the other hand, first-mention annotation where all the co-reference relations are targeting the first mention of the referent. The study reported here compares the distributional results observed on both annotations. Our experimental results confirm hypotheses of the literature regarding the ability of definite, demonstrative or pronominal mention to anchor a reference chain. In addition, this comparative study provides original findings on the transitions between definite and indefinite mentions, and noun phrases and pronouns, in reference chains. Lastly this comparison shows that standard heuristics concerning gender and number agreement in reference chains are not affected by the annotation scheme.
© Owned by the authors, published by EDP Sciences, 2016
This is an Open Access article distributed under the terms of the Creative Commons Attribution License 4.0, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.