JeuxDeMots : Un réseau lexico-sémantique pour le français, issu de jeux et d’inférences

Mathieu Lafourcade & Nathalie Le Brun
Classé dans : Numéro 27 — 2020

Télécharger / Download

Abstract

The JeuxDeMots project aims to build a broad knowledge base in French, both common sense and specialised, using games, contributory approaches, and inference mechanisms. A dozen games have been designed as part of this project, each one allowing collecting specific information, or to consolidate the information acquired through the other games. This article describes, both qualitatively and quantitatively, the data collected and constructed since the launch of the project in the summer of 2007. In particular, we discuss the following aspects: the structure of the lexical and semantic network, some types of relations (semantic, ontological, subjective, semantic roles, associations of ideas), annotation of relations (meta-information), semantic refinements (management of polysemy), the creation of clusters allowing the representation of richer knowledge (n-argument relations). Finally, we will describe some complementary acquisition methods such as a bot for endogenous contributions as well as a chatbot making inferences.

Keywords: lexical semantic network, knowledge base, GWAPs, lexical relations, semantic relations, knowledge representation, fuzzy knowledge, lexical acquisition.

______________________________________________________________________________

Résumé

Le projet JeuxDeMots a pour but de construire une base de connaissances de sens commun et de spécialité, en français, à l’aide de jeux, d’approches contributives, et de mécanismes d'inférence. Une dizaine de jeux ont été conçus dans le cadre de ce projet, chacun permettant de collecter des informations spécifiques, ou de consolider les informations acquises via les autres jeux. Dans cet article nous décrirons quantitativement et qualitativement les données collectées et construites, depuis le lancement du projet durant l’été 2007. Nous décrirons en particulier les aspects suivants : la structure du réseau lexical et sémantique JeuxDeMots, certains types de relations (sémantiques, ontologiques, subjectives, rôles sémantiques, associations d’idées, etc.), l’annotation de relations (méta-informations), les raffinements sémantiques (gestion de la polysémie), la création de termes agglomérés permettant la représentation de connaissances plus riches (relations à n-arguments). Enfin, nous décrirons des méthodes d’acquisition complémentaires, à savoir ce que peuvent faire des robots effectuant des contributions endogènes sur les données, ainsi qu’un chatbot réalisant des inférences.

Mots-clefs : réseau lexico-sémantique, base de connaissances, GWAPs, relations lexicales, relations sémantiques, représentation des connaissances, connaissances incertaines et floues, acquisition lexicale.