Issue |
SHS Web of Conferences
Volume 8, 2014
4e Congrès Mondial de Linguistique Française
|
|
---|---|---|
Page(s) | 2583 - 2596 | |
Section | Ressources et Outils pour l'analyse linguistique | |
DOI | https://doi.org/10.1051/shsconf/20140801223 | |
Published online | 24 July 2014 |
Construction d'un lexique flexionnel phonétisé libre du français
1
Laboratoire de Linguistique Formelle (UMR 7110, U. Paris Diderot & CNRS), 8, place Paul Ricoeur, 75013 Paris, France
2
Université de la Réunion, LCF-LIL (EA 4549), 15, avenue René Cassin, 97715 Saint-Denis Messag Cedex 9, France
Contact : olivier.bonami@paris-sorbonne.fr
Cette proposition de communication décrit la ressource Flexique, un lexique flexionnel phonétisé du français standard, distribué sous licence libre. La construction de Flexique a été motivée par les besoins de l’étude quantitative du système flexionnel du français, et comble un manque dans l’ensemble des ressources disponibles, qui sont soit difficiles d’accès, soit incomplètes, soit onéreuses. Flexique a été construit à partir de la ressource Lexique (New Pallier, Ferrand et Matos 2001), une base de données lexicale de 150 000 mots combinant des informations phonétiques, lexicales, morphosyntaxiques et fréquentielles. Les objectifs de Flexique étant partiellement différents de ceux de Lexique, la structure a été refondée et une organisation par lexèmea été adoptée. De plus et surtout, les transcriptions phonétiques ont été entièrement reprises, ce qui a impliqué la construction d’une interface de correction semi-guidée, la correction manuelle d’environ 65 000 formes clé, l’inférence automatique d’environ 300 000 formes supplémentaires à l’aide de fléchisseurs par règles, et la validation semi-automatique des résultats par examen des propriétés structurelles du lexique résultant. L’article décrit les principales caractéristiques de Flexique, détaille les conventions de transcription et la méthode de construction de la ressource, et présente quelques applications préliminaires à l’étude instrumentée de l’organisation des paradigmes de flexion.
© aux auteurs, publié par EDP Sciences, 2014
Article en accès libre placé sous licence Creative Commons Attribution 4.0
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.