S0004 : BDLEX
Il s'agit d'une base de données lexicales développée dans le cadre du
groupe de recherche PRC (Communication Homme-Machine) au laboratoire IRIT
de l'Université Paul Sabatier de Toulouse.
La base BDLex contient environ 440 000 formes fléchies (issues de 50 000
formes canoniques). Les informations associées sont la graphie accentuée,
la prononciation, des attributs morphosyntaxiques (catégorie syntaxique,
accords, ...), la graphie du mot canonique et un indicateur de fréquence.
Les ressources contiennent en outre la version BDLex-syll où les frontières
syllabiques sont précisées dans le champ prononciation.
La ressource ELRA-S0004 BDLEX version 2.1.2 comprend les ressources BDLex et par ailleurs le lexique MHATlex Standard qui est une version simplifiée de MHATLex (S0100) et apparentée à BDLex.
|